痛点:Prompt Engineering 的天花板
2026 年初,AI Agent 开发者面临一个普遍困境:
- 系统提示词越来越长,动辄数千 token
- 每次模型更新都要重新调试 prompt
- 不同 Agent 框架的 prompt 格式互不兼容
- 团队协作时 prompt 版本管理形同虚设
Anthropic 在 2026 年 5 月发布的 Claude Skills 蓝图,试图用标准化方案终结这个混乱时代。
方案:从 Prompt 到 Skill
核心转变可以用一张表说清楚:
| 旧范式 | 新范式 | 文件形式 |
|---|---|---|
| Prompt Engineering | Skill Engineering | SKILL.md |
| 系统提示词(System Prompt) | Skill 定义 | skill.yaml |
| 函数调用(Function Calling) | Tool 集成 | tools/ |
| 手动调试 prompt | 版本化 Skill 管理 | Git 仓库 |
| 框架间互不兼容 | 跨框架统一标准 | 35+ 框架支持 |
关键变化
SKILL.md 取代系统提示词。开发者不再写几千字的 system prompt,而是用结构化的 SKILL.md 文件定义 Agent 的能力、约束和行为模式。
35+ Agent 框架统一支持。包括 Hermes Agent、OpenClaw、CrewAI、LangChain、LangGraph、AutoGen 等主流框架均已适配。这意味着一个 Skill 可以跨框架复用。
1 条 CLI 命令部署。不再需要为每个框架单独编写集成代码。
对标分析
竞品格局
| 方案 | 发起方 | 支持框架数 | 标准化程度 | 开源协议 |
|---|---|---|---|---|
| Claude Skills | Anthropic | 35+ | 高(33页规范) | 开放 |
| OpenAI Custom GPTs | OpenAI | 1(仅 OpenAI) | 中 | 闭源 |
| LangChain Templates | LangChain | 5+ | 中 | 开源 |
| Dify 插件 | Dify | 1(仅 Dify) | 低 | 开源 |
Skills 的优势在于:它不是某个产品的功能,而是一个行业标准的提案。35+ 框架的自发支持,说明社区对统一标准的需求极其强烈。
与 Cursor Skills 的关系
值得注意的是,Cursor 团队也在同期开源了 Workflow Plugin Skills。这两者不是竞争关系——Cursor 的 Skills 聚焦于 IDE 内的工作流自动化,而 Claude Skills 是跨框架的通用 Agent 能力定义。
上手指南
最小 Skill 示例
# skill.yaml
name: code-reviewer
version: 1.0
description: "自动代码审查 Agent"
model: claude-sonnet-4-20260505
# SKILL.md
## 角色
你是一个资深代码审查专家,专注于 Python 项目。
## 能力
- 识别代码异味和反模式
- 提出重构建议
- 评估性能瓶颈
- 检查安全隐患
## 约束
- 只审查 Python 代码
- 每次审查不超过 5 条核心建议
- 引用 PEP 8 和相关最佳实践
在已有项目中迁移
- 盘点现有 prompt:列出所有系统提示词
- 提取核心能力:将每个 prompt 的核心行为抽象为 Skill
- 编写 SKILL.md:按规范重构
- 跨框架测试:在至少 2 个不同框架上验证
- 版本管理:将 Skill 纳入 Git 工作流
为什么值得现在关注
- 标准正在固化:35+ 框架的支持意味着这个标准已经过了”概念验证”阶段
- 迁移成本可控:SKILL.md 的格式简单,现有 prompt 的迁移工作量不大
- 长期收益显著:版本化、可复用、跨框架——这些都是团队规模化开发的刚需
- Anthropic 生态绑定:早期采用 Skills 的团队,将在 Claude 生态中获得更好的集成体验
风险提醒
- Skills 规范仍在快速迭代,API 可能不向后兼容
- 不是所有 Agent 场景都适合 Skill 化(简单问答无需 Skills)
- 过度依赖单一标准可能限制技术选型的灵活性
Anthropic 这步棋的本质是:用开源标准锁定开发者生态。当年 OpenAI 用 GPT API 做了一样的事,现在 Anthropic 用 Skills 做第二轮。对开发者来说,越早掌握这套范式,在未来 1-2 年的 Agent 开发中越有先发优势。