Karpathy 免费放出 3 小时 LLM 全栈课程：从 Tokenization 到 RLHF 一条龙

有人估算这堂课程如果放到商业平台上，定价至少 2000 美元。Karpathy 直接放在了 YouTube 上，免费。

Andrej Karpathy——前 OpenAI 总监、前 Tesla AI 总监——在 YouTube 发布了一门 3 小时的 LLM 全栈课程。这不是那种"10 分钟了解大模型"的科普视频，而是从底层原理到前沿研究的完整技术路线。

课程覆盖了什么

内容密度很高，按主题拆解：

Tokenization。 不是简单讲 BPE，而是从 tokenization 的设计取舍讲起——为什么选择 subword、不同 tokenization 方案对模型表现的影响、多语言 tokenization 的坑。

神经网络内部机制。 Karpathy 的招牌环节。前馈层、注意力层、归一化层各自在做什么，激活值分布、梯度流、训练中的数值稳定性问题。

幻觉（Hallucinations）。 为什么模型会产生幻觉、幻觉的根源是训练数据问题还是架构问题、当前主流的缓解方案及其局限性。

工具使用（Tool Use）。 模型如何调用外部工具、function calling 的实现机制、工具调用中的安全性和可靠性挑战。

强化学习与 RLHF。 从 PPO 到 DPO 到 RLHF 的演进路径，reward modeling 的设计，以及 RLHF 在实际训练中的工程细节。

DeepSeek 与 AlphaGo。 用 DeepSeek 的推理策略和 AlphaGo 的强化学习方法作为案例，把学术概念和实际系统连接起来。

Karpathy 有一个能力：把复杂的技术概念用直觉化的方式讲清楚。他不是那种"先定义公式再推导"的学院派，而是"先给直觉再给细节"的工程师视角。

这堂课最大的价值不是"学到了新知识"——对于已经在这个领域工作的人来说，大部分内容你可能已经知道了。真正的价值是系统化。

LLM 领域发展太快，大部分人的知识是碎片化的：看过几篇论文、读过几篇博客、用过几个 API，但缺乏一个完整的知识框架。Karpathy 的课程提供了一个从底层到应用层的完整地图，帮你把碎片拼成全景图。

如果你正在做或打算做以下事情，这堂课值得花 3 小时：

如果你已经是 LLM 领域的资深从业者，这堂课可能不会有太多新东西，但 Karpathy 的讲解视角和案例选择仍然值得参考。

课程链接在 YouTube 搜索"Andrej Karpathy LLM"即可找到。

主要来源：