发生了什么
在 LangChain、CrewAI、AutoGen 等 Agent 框架已经非常成熟的 2026 年,一个反其道而行之的开源教程正在 GitHub 上走红:它教开发者不用任何框架,从零手写构建 AI Agent 的每一个层级。
项目已获得 1,500+ Star,社区反馈显示,越来越多的开发者对框架的”黑盒化”感到不安——当框架替你处理了工具调用、状态管理、多 Agent 协调的所有细节时,你其实不理解 Agent 在做什么,也不知道出了 bug 该怎么修。
教程的渐进式架构
该教程将 Agent 开发拆解为清晰的阶段,每个阶段只引入一个新概念:
Phase 1:单 Agent 基础能力(Steps 0-6)
| Step | 内容 | 核心知识点 |
|---|---|---|
| 0 | 基础聊天循环 | LLM API 调用、消息格式 |
| 1 | System Prompt 工程 | 角色定义、行为约束 |
| 2 | 工具定义与调用 | Function calling schema |
| 3 | 工具执行层 | 解析 LLM 输出、执行工具、处理结果 |
| 4 | 循环控制 | 工具调用→结果反馈→下一轮的循环逻辑 |
| 5 | 错误处理 | 工具调用失败的重试与回退 |
| 6 | 上下文管理 | Token 计数、上下文截断策略 |
Phase 2:记忆系统(Steps 7-10)
引入短期记忆(对话历史)和长期记忆(向量存储)的实现。教程展示了如何在不依赖框架的情况下构建 RAG 管道——从文本分块、向量化到相似度检索,每一步都是透明的。
Phase 3:多 Agent 协调(Steps 11+)
教程的高阶部分展示了如何从单 Agent 扩展到多 Agent 系统:
- 角色分配:不同 Agent 承担不同职责(规划者、执行者、审核者)
- 消息传递:Agent 之间的通信协议设计
- 冲突解决:当多个 Agent 给出矛盾输出时的仲裁机制
为什么”不用框架”反而火了?
框架的隐性成本
2026 年的 Agent 框架生态已经高度成熟,但成熟也带来了问题:
- 调试困难:当 LangChain 的 Chain 报错时,错误信息往往指向框架内部而非你的逻辑
- 性能开销:框架抽象层增加了不必要的序列化/反序列化开销
- 供应商锁定:基于特定框架构建的系统迁移成本极高
- 学习曲线:掌握 LangChain/CrewAI 的 DSL 语法本身就是一项技能投资
手写 Agent 的三个不可替代价值
| 价值 | 说明 |
|---|---|
| 完全可控 | 你知道每一行代码在做什么,debug 不需要猜测框架行为 |
| 性能最优 | 没有框架开销,可以针对特定场景做极致优化 |
| 架构灵活 | 不受框架设计理念约束,可以混合搭配不同模式 |
框架 vs 手写的选择矩阵
| 场景 | 推荐方案 | 理由 |
|---|---|---|
| PoC / 快速验证 | LangChain / CrewAI | 开发速度快,原型迭代灵活 |
| 生产环境 | 手写核心 + 框架辅助 | 核心路径可控,边缘功能用框架 |
| 高并发服务 | 手写 | 框架性能开销不可接受 |
| 多 Agent 复杂编排 | CrewAI + 自定义 | 多 Agent 编排手写成本过高 |
| 学习/教学 | 从零手写 | 理解底层原理的最佳路径 |
可以怎么用
这个教程最适合两类人:
- 已经用过 LangChain/CrewAI 但想理解底层原理的开发者:用教程作为”逆向工程”的参考,理解框架背后到底在做什么
- 需要在生产环境中构建高性能 Agent 系统的工程师:基于教程的架构,针对你的业务场景做定制化优化
一个实用的建议:不要二选一。用框架做快速原型验证想法,确认方案可行后,用教程的思路重写核心路径,保留框架仅用于非关键的辅助功能。