2026 年 3 月,MiniMax 发布了 M2.7 模型。它不是又一个「参数更大、benchmark 更高」的常规更新,而是引入了一种新的模型训练范式:让模型深度参与迭代自身。
核心创新:模型自我进化
M2.7 的最大亮点可以用一句话概括:
模型不再是被训练的对象,而是参与训练过程的主动参与者。
具体机制:
- 构建 Agent Harness:M2.7 驱动自身的复杂 Agent 工作流
- 强化学习循环:通过 Agent 执行任务的结果反馈,模型直接参与优化自己的策略
- 自我迭代:模型在 SWE-bench 等编程任务上持续改进,形成闭环
这与传统的 RLHF(人类反馈强化学习)有本质区别——RLHF 依赖人类标注者提供偏好信号,而 M2.7 的自我进化循环中,模型通过 Agent 框架自主发现错误、修复问题、验证结果,形成无需人类介入的优化循环。
SWE-bench 表现
M2.7 在 SWE-bench 上的成绩接近 Anthropic Opus 水平。虽然具体的分数没有在官方材料中完整披露,但社区对比数据显示:
| 模型 | SWE-bench(预估) | 价格 ($/M 输入) |
|---|---|---|
| Claude Opus 4.7 Max | 87.6% | $15.00 |
| MiniMax M2.7 | ≈ 82-85% | $0.30 |
| Kimi K2.6 | ≈ 80-83% | ~$0.50 |
| DeepSeek V4-Pro | ≈ 80-83% | $0.60 |
| GPT-5.5 | ≈ 83-85% | $5.00 |
考虑到 M2.7 的输入价格仅为 $0.30/百万 token(约 2.1 元人民币),它的性价比在编程模型中极具竞争力。
定价:国产模型的价格战继续
2026 年 3 月的主流大模型 API 价格格局:
| 模型 | 输入 ($/M) | 输出 ($/M) |
|---|---|---|
| Grok | $0.20 | - |
| MiniMax M2.7 | $0.30 | 未公开 |
| DeepSeek V4 | ~$0.60 | ~$1.20 |
| GPT-5.5 | $5.00 | $30.00 |
| Claude Opus 4.7 | $15.00 | $75.00 |
MiniMax 的定价策略非常激进——以接近 DeepSeek 的价格水平,提供接近 Opus 的编程能力。对于 Agent 工作流中需要大量 API 调用的场景,成本差异是数量级的。
自我进化的意义与风险
为什么自我进化重要
传统模型训练的瓶颈在于:
- 数据依赖:需要大量高质量训练数据
- 人类标注:RLHF 需要大量人类标注者
- 迭代周期:每次模型更新需要数月时间
M2.7 的自我进化模式如果可行,意味着:
- 模型可以持续从真实使用中学习
- 迭代周期可能从月级缩短到周级甚至日级
- 特定领域的优化可以更加精准
潜在风险
自我进化并非没有隐忧:
- 能力退化风险:如果 Agent 循环中的反馈信号有偏差,模型可能在优化某一能力的同时退化其他能力
- 安全对齐问题:自我优化可能绕过人类设置的安全约束
- 不可解释性:模型通过自主循环学到的能力,其决策路径更难追溯
与其他国产模型的对比
| 维度 | MiniMax M2.7 | Kimi K2.6 | DeepSeek V4-Pro | GLM-5.1 |
|---|---|---|---|---|
| 编程能力 | 接近 Opus | Entry 梯队 | Entry 梯队 | Entry 梯队 |
| 自我优化 | ✅ Agent 驱动 RL | ❌ | ❌ | ❌ |
| 开源 | 部分 | 开源权重 | 完全开源 (MIT) | 部分开源 |
| 价格优势 | 极高 | 高 | 高 | 极高 |
| 生态成熟度 | 中等 | 高 | 高 | 中等 |
MiniMax M2.7 在「自我进化」这个维度上是目前唯一有实质性动作的国产模型。这使得它在长期竞争力上有一个独特的差异化优势。
行动建议
适合 MiniMax M2.7 的场景
- 高频 Agent 编程工作流:需要大量 API 调用的代码生成、审查、修复场景
- 成本敏感型项目:预算有限但对编程质量有要求的团队
- 技术尝鲜:想体验模型自我进化效果的开发者和研究者
暂不适合的场景
- 生产环境核心系统:自我进化模型的稳定性需要更多时间验证
- 需要可解释性的场景:如果决策过程需要审计追踪,建议选择更成熟的模型
- 非编程场景:M2.7 的优势集中在编程领域,通用任务可能不如其他模型
2026 年国产 AI 实用化的信号
MiniMax 总裁此前曾公开表示,M2.5 开始产品”已经实用了”,到 M2.7 进一步强化了编程 Agent 能力。结合 Kimi 2.5、GLM-5、MiniMax M2.5 都在 2026 年初跨过”实用临界点”的行业共识,2026 年确实是国产 AI 实用化的元年。
M2.7 的自我进化模式是否代表了未来模型训练的方向,还需要更多时间验证。但它至少证明了一件事:中国模型厂商不再只是在跟随 OpenAI 和 Anthropic 的技术路线,而是在探索差异化的创新路径。
主要来源: