🎓 姚班游戏系列

基于大语言模型算法研发的教育游戏

培养20-30年生命周期的核心能力:数学基础、算法思维、深度学习原理

🏔️

梯度下山

优化算法可视化

在多维地形中寻找最低点,直观理解梯度下降、动量法、Adam等优化算法的原理和特性。

  • 核心概念: 梯度下降、学习率、动量
  • 4种地形: 凸函数、非凸、鞍点、峡谷
  • 4种优化器: GD、Momentum、Adam、SGD
  • 教育价值: 理解神经网络训练的核心
开始游戏 →
🔷

矩阵迷宫

线性代数可视化

通过矩阵变换改变向量空间,几何直观地理解线性变换、特征值、行列式等核心概念。

  • 核心概念: 线性变换、矩阵乘法、行列式
  • 6个关卡: 旋转、缩放、反射、剪切、投影
  • 实时可视化: 网格变形、基向量变化
  • 教育价值: 理解神经网络权重矩阵
开始游戏 →
🎲

概率迷雾

贝叶斯推理

在不确定的世界中,通过收集证据使用贝叶斯推理更新信念,做出最优决策。

  • 核心概念: 贝叶斯定理、先验后验、似然
  • 4个场景: 医疗诊断、垃圾邮件、犯罪推理
  • 实时计算: 显示完整的贝叶斯更新过程
  • 教育价值: 理解概率图模型和生成模型
开始游戏 →
🧠

神经网络工厂

网络架构设计

拖拽式构建神经网络,添加层、配置参数,实时训练并观察效果。

  • 核心概念: 前向传播、反向传播、激活函数
  • 4个任务: XOR、圆形、螺旋、手写数字
  • 样例网络: 简单、深度、正则化、ResNet
  • 教育价值: 理解神经网络的层次结构
开始游戏 →
👁️

注意力竞技场

Attention机制

可视化注意力权重,理解Query-Key-Value机制,掌握Transformer的核心。

  • 核心概念: 自注意力、多头注意力、QKV
  • 注意力热力图: 实时显示权重分布
  • 3种类型: Self、Masked、Cross Attention
  • 教育价值: 理解Transformer架构
开始游戏 →
🧪

语言模型炼金术

LLM训练模拟

配置模型架构,选择数据集,模拟大语言模型的完整训练过程。

  • 核心概念: 预训练、微调、困惑度、规模定律
  • 4个预设: Tiny、Small、Base、Large
  • 3个阶段: 预训练、微调、RLHF
  • 教育价值: 理解LLM训练全流程
开始游戏 →
💬

提示工程实验室

Prompt Engineering

编写和优化提示词,学习如何与AI有效沟通,掌握提示工程核心技巧。

  • 核心概念: 上下文学习、Few-Shot、CoT推理
  • 5个关卡: 基础、角色、示例、推理、工具
  • 实时评分: 准确性、完整性、效率
  • 教育价值: 理解提示工程和任务分解
开始游戏 →
🎮

强化学习竞技场

Reinforcement Learning

训练智能体通过奖励学习最优策略,理解RLHF在大模型对齐中的应用。

  • 核心概念: Q-Learning、策略梯度、RLHF
  • 4个环境: 网格世界、悬崖、迷宫、对话
  • 3种算法: Q-Learning、SARSA、PPO
  • 教育价值: 理解ChatGPT的RLHF训练
开始游戏 →
🎨

多模态融合

Multimodal Fusion

融合视觉、文本、音频信息,理解GPT-4V、Gemini等多模态模型原理。

  • 核心概念: 模态编码、特征对齐、跨模态学习
  • 4种融合: 早期、晚期、注意力、Transformer
  • 4个任务: 分类、检索、生成、问答
  • 教育价值: 理解CLIP、GPT-4V原理
开始游戏 →

🎯 设计理念

这个游戏系列不是教"如何使用ChatGPT",而是教"如何创造ChatGPT"。 我们培养的是能够跨越20-30年的底层能力,而不是短期的工具使用技能。

第一阶段 (已完成)

✅ 梯度下山 - 优化算法
✅ 矩阵迷宫 - 线性代数
✅ 概率迷雾 - 贝叶斯推理

第二阶段 (已完成)

✅ 神经网络工厂
✅ 注意力竞技场
✅ 语言模型炼金术

第三阶段 (已完成)

✅ 提示工程实验室
✅ 强化学习竞技场
✅ 多模态融合

💡 核心能力培养

🌟 为什么这些能力能持续20-30年?

基础性:不依赖特定工具或框架,理解底层原理
原理性:理解why而不仅是how,能够举一反三
可迁移:适用于未来的新技术和新场景
创造性:能够创新而不仅是使用现有工具