姚班游戏系列 - 算法科学教育

🏔️

梯度下山

优化算法可视化

在多维地形中寻找最低点，直观理解梯度下降、动量法、Adam等优化算法的原理和特性。

核心概念: 梯度下降、学习率、动量
4种地形: 凸函数、非凸、鞍点、峡谷
4种优化器: GD、Momentum、Adam、SGD
教育价值: 理解神经网络训练的核心

开始游戏 →

🔷

矩阵迷宫

线性代数可视化

通过矩阵变换改变向量空间，几何直观地理解线性变换、特征值、行列式等核心概念。

核心概念: 线性变换、矩阵乘法、行列式
6个关卡: 旋转、缩放、反射、剪切、投影
实时可视化: 网格变形、基向量变化
教育价值: 理解神经网络权重矩阵

开始游戏 →

🎲

概率迷雾

贝叶斯推理

在不确定的世界中，通过收集证据使用贝叶斯推理更新信念，做出最优决策。

核心概念: 贝叶斯定理、先验后验、似然
4个场景: 医疗诊断、垃圾邮件、犯罪推理
实时计算: 显示完整的贝叶斯更新过程
教育价值: 理解概率图模型和生成模型

开始游戏 →

🧠

神经网络工厂

网络架构设计

拖拽式构建神经网络，添加层、配置参数，实时训练并观察效果。

核心概念: 前向传播、反向传播、激活函数
4个任务: XOR、圆形、螺旋、手写数字
样例网络: 简单、深度、正则化、ResNet
教育价值: 理解神经网络的层次结构

开始游戏 →

👁️

注意力竞技场

Attention机制

可视化注意力权重，理解Query-Key-Value机制，掌握Transformer的核心。

核心概念: 自注意力、多头注意力、QKV
注意力热力图: 实时显示权重分布
3种类型: Self、Masked、Cross Attention
教育价值: 理解Transformer架构

开始游戏 →

🧪

语言模型炼金术

LLM训练模拟

配置模型架构，选择数据集，模拟大语言模型的完整训练过程。

核心概念: 预训练、微调、困惑度、规模定律
4个预设: Tiny、Small、Base、Large
3个阶段: 预训练、微调、RLHF
教育价值: 理解LLM训练全流程

开始游戏 →

💬

提示工程实验室

Prompt Engineering

编写和优化提示词，学习如何与AI有效沟通，掌握提示工程核心技巧。

核心概念: 上下文学习、Few-Shot、CoT推理
5个关卡: 基础、角色、示例、推理、工具
实时评分: 准确性、完整性、效率
教育价值: 理解提示工程和任务分解

开始游戏 →

🎮

强化学习竞技场

Reinforcement Learning

训练智能体通过奖励学习最优策略，理解RLHF在大模型对齐中的应用。

核心概念: Q-Learning、策略梯度、RLHF
4个环境: 网格世界、悬崖、迷宫、对话
3种算法: Q-Learning、SARSA、PPO
教育价值: 理解ChatGPT的RLHF训练

开始游戏 →

🎨

多模态融合

Multimodal Fusion

融合视觉、文本、音频信息，理解GPT-4V、Gemini等多模态模型原理。

核心概念: 模态编码、特征对齐、跨模态学习
4种融合: 早期、晚期、注意力、Transformer
4个任务: 分类、检索、生成、问答
教育价值: 理解CLIP、GPT-4V原理

开始游戏 →

🎓 姚班游戏系列

梯度下山

矩阵迷宫

概率迷雾

神经网络工厂

注意力竞技场

语言模型炼金术

提示工程实验室

强化学习竞技场

多模态融合

🎯 设计理念

第一阶段 (已完成)

第二阶段 (已完成)

第三阶段 (已完成)

💡 核心能力培养

🌟 为什么这些能力能持续20-30年？