结论先放前面:如果你要最强长任务编码,我会先试 Fable 5;如果你已经深绑 OpenAI 工具栈,GPT-5.5 仍然是更稳的组织选择。
Anthropic 6 月 9 日发布 Claude Fable 5 和 Mythos 5,把 Fable 放在 Opus 之上的 Mythos-class 公开层级;OpenAI 的 GPT-5.5 则在 4 月进入 API,官方给出 1M context、Responses 和 Chat Completions 支持,并列出 SWE-Bench Pro、Terminal-Bench、GDPval 等评测。
跑分层面,Fable 5 的新闻热度很高,BenchLM 等榜单也把它放在 SWE-bench Verified 前列。但我不建议只按榜单迁移。原因很简单:编码模型的真实成本不在单题正确率,而在它能不能接你的 repo、CI、权限、review 流程,以及出错时能不能定位。
Fable 5 的优势是长任务和代理能力叙事更强,适合复杂重构、研究型 coding 和高难度 debug。GPT-5.5 的优势是 OpenAI 生态更完整,Codex、Agents SDK、Responses API 和企业接入路径更连贯。
我的选择建议:个人或小团队,拿同一组真实 issue 跑 3 天再决定;企业团队,先评估审计、数据边界和已有平台依赖。模型强,不代表迁移划算。
这一局没有通吃答案。写代码选模型,别像买显卡一样只看最高帧率。
主要来源: