核心判断
智谱在 GLM-5.1 发布后不到一个月就宣布大幅降价,这不是单纯的促销——这是中国 AI 模型价格战的又一次升级。当 1 万亿参数的旗舰模型输入价格降到 $0.60/M tokens 时,整个行业的定价体系都需要重估。
新价格表
| 模型 | 输入价格 | 输出价格 | 降幅 |
|---|---|---|---|
| GLM-5 | $0.60/M tokens | $1.92/M tokens | 40% |
| GLM-5.1 | $0.98/M tokens | $3.08/M tokens | 30% |
对比国际同类产品:
| 模型 | 输入价格 | 输出价格 |
|---|---|---|
| GLM-5.1 | $0.98 | $3.08 |
| Claude Sonnet 4 | ~$3.00 | ~$15.00 |
| GPT-5.5 | ~$2.50 | ~$10.00 |
| DeepSeek V4 | ~$0.55 | ~$2.20 |
GLM-5.1 的定价已经逼近 DeepSeek V4 的价位,同时保持着与 Claude Sonnet 4 相当的编程能力。这个性价比组合非常有杀伤力。
降价的三重逻辑
1. 规模效应释放
GLM-5.1 采用 MoE(混合专家)架构,1 万亿参数中每个 token 只激活约 320 亿参数。这意味着:
- 实际推理成本远低于参数规模暗示的水平
- 随着推理量增加,边际成本持续下降
- 有空间把成本优势传递给用户
2. 生态抢占窗口
过去 12 天,中国四家 AI 实验室密集发布了四款前沿编程模型:
- GLM-5.1(智谱)
- M2.7(MiniMax)
- K2.6(月之暗面)
- DeepSeek V4(深度求索)
四家模型在 SWE-Bench Pro 上都达到了 56-58 分的水准,能力差距不大。这时候谁先降价,谁就能在开发者心智中建立"首选"地位。
3. 对标国际定价
GLM-5.1 降价后的价格约为 Claude Sonnet 4 的 1/3。考虑到两者在编程任务上的表现已经非常接近,这个价差会促使大量价格敏感的开发者从 Claude 迁移到 GLM。
对行业的影响
对其他国产模型的压力
| 厂商 | 当前处境 | 可能反应 |
|---|---|---|
| DeepSeek | 价格已经很低($0.55/M) | 可能不需要跟进,保持性价比优势 |
| Kimi K2.6 | 刚发布,价格未大幅调整 | 压力最大,可能很快跟进降价 |
| MiniMax M2.7 | IPO 后需要平衡收入和增长 | 选择性降价,保护利润率 |
对国际模型的冲击
当中国模型以 1/3 的价格提供相当的能力时:
- 东南亚、中东、拉美市场会成为国产模型的突破口
- 美国市场由于监管和地缘政治因素受影响较小
- 欧洲市场会成为中国模型国际化的关键战场
开发者的选择策略
适合 GLM-5.1 的场景
- 大规模代码生成:输入价格低,适合大文件处理
- 长上下文任务:GLM-5 系列支持超长上下文,降价后成本可控
- 多模型对比测试:用 GLM 做 baseline,成本几乎可以忽略
仍然需要考虑的场景
- 英文创意写作:Claude 和 GPT 在英文文本质量上仍有优势
- 企业合规要求:部分行业对数据出境有严格限制,需要评估 GLM 的数据处理政策
- 生态依赖:已经深度集成 Claude/GPT 工具链的团队,迁移成本需要计算
行动建议
- 立即测试 GLM-5.1 的新价格:用你的核心 prompt 跑一遍,看质量和成本是否满足要求
- 关注 Kimi 和 MiniMax 的后续动作:价格战可能才刚刚开始
- 评估多模型路由:根据任务类型自动选择最便宜的模型,可以进一步降低成本
- 注意"无限"条款:GMI 平台标注 "unlimited",但需确认是否有隐形的速率限制