发生了什么
2026 年 4 月 29 日,一组对比数据在社区引发讨论:Claude Opus 4.7 与 GPT-5.5 的核心优势维度出现了明确的分化。Claude Code 负责人 Boris Cherny 发帖确认了从旧模型迁移到 Opus 4.7 确实需要”适应期”——该帖获得 936 个 likes,来自一线开发者的共鸣。
分化的提示哲学
| 维度 | Claude Opus 4.7 | GPT-5.5 |
|---|---|---|
| 核心优势 | 写作、推理、总结 | 代码、工具生态 |
| 交互风格 | 对话式、类人推理 | 工具式、结构化执行 |
| 体验反馈 | ”不那么机械" | "功能丰富但需要调教” |
| 最佳场景 | 长文写作、研究分析 | 开发者工具、API 集成 |
| SWE-Bench Pro | 64.3% | 58.6% |
| MCP Atlas | 79.1% | 75.3% |
| Terminal-Bench | 落后 | 82.7%(领先) |
Opus 4.7 在需要架构思维的任务上表现更突出:SWE-Bench Pro、MCP Atlas、GPQA Diamond、HLE(有/无工具)、FinanceAgent v1.1 均胜出。
GPT-5.5 则在工具链深度和终端交互上占据优势:Terminal-Bench 82.7% 是目前的最高分。
迁移适应期的真相
Boris Cherny 提到的”适应期”不是性能问题,而是交互范式的变化。Opus 4.7 相比 4.6:
- 更倾向于自主推理而非被动等待指令
- 在复杂任务中表现出更强的”思考链”能力
- 对模糊指令的容忍度更高,但这也意味着输出可能偏离预期
这解释了为什么一些开发者在初期感到不适——他们习惯了 4.6 的”听话模式”,而 4.7 更像一个有主见的协作者。
价格争议
与此同时,Opus 4.7 的定价引发了广泛讨论:
- API 价格:$5.00 输入 / $25.00 输出(每 1M tokens)
- Kimi K2.6:$0.80-0.95 输入 / $3.60-4.00 输出(便宜约 7 倍)
- GLM-5.1:$1.40 输入 / $4.40 输出(便宜约 5-6 倍)
更关键的是,GitHub Copilot 宣布 6 月 1 日起将 Opus 模型的倍率从 3x 提升至 27x——相当于 9 倍价格涨幅。这已经不是”价格调整”,而是”品类变更”。
选择建议
| 你的角色 | 推荐模型 | 原因 |
|---|---|---|
| 内容创作者/研究者 | Claude Opus 4.7 | 写作质量和推理深度领先 |
| 全栈开发者 | GPT-5.5 | 工具生态和 API 集成最强 |
| 架构师/技术负责人 | Claude Opus 4.7 | SWE-Bench Pro 和 MCP Atlas 表现更优 |
| 预算敏感团队 | Kimi K2.6 或 GLM-5.1 | 接近 Opus 70-80% 的能力,价格 1/5-1/7 |
| DevOps/终端重度用户 | GPT-5.5 | Terminal-Bench 最强 |
格局判断
AI 模型的竞争正在从”谁更聪明”转向”谁更适你的工作流”。Opus 4.7 和 GPT-5.5 的分化表明:没有全能冠军,只有场景赢家。提示工程的重点也从”如何让模型听话”转向”如何根据模型特性设计工作流”。