MiniMax M2.7：让模型自己训练自己，自我进化的编程 Agent 来了

2026 年 3 月，MiniMax 发布了 M2.7 模型。它不是又一个「参数更大、benchmark 更高」的常规更新，而是引入了一种新的模型训练范式：让模型深度参与迭代自身。

核心创新：模型自我进化

M2.7 的最大亮点可以用一句话概括：

模型不再是被训练的对象，而是参与训练过程的主动参与者。

具体机制：

构建 Agent Harness：M2.7 驱动自身的复杂 Agent 工作流
强化学习循环：通过 Agent 执行任务的结果反馈，模型直接参与优化自己的策略
自我迭代：模型在 SWE-bench 等编程任务上持续改进，形成闭环

这与传统的 RLHF（人类反馈强化学习）有本质区别——RLHF 依赖人类标注者提供偏好信号，而 M2.7 的自我进化循环中，模型通过 Agent 框架自主发现错误、修复问题、验证结果，形成无需人类介入的优化循环。

SWE-bench 表现

M2.7 在 SWE-bench 上的成绩接近 Anthropic Opus 水平。虽然具体的分数没有在官方材料中完整披露，但社区对比数据显示：

模型	SWE-bench（预估）	价格 ($/M 输入)
Claude Opus 4.7 Max	87.6%	$15.00
MiniMax M2.7	≈ 82-85%	$0.30
Kimi K2.6	≈ 80-83%	~$0.50
DeepSeek V4-Pro	≈ 80-83%	$0.60
GPT-5.5	≈ 83-85%	$5.00

考虑到 M2.7 的输入价格仅为 $0.30/百万 token（约 2.1 元人民币），它的性价比在编程模型中极具竞争力。

定价：国产模型的价格战继续

2026 年 3 月的主流大模型 API 价格格局：

模型	输入 ($/M)	输出 ($/M)
Grok	$0.20	-
MiniMax M2.7	$0.30	未公开
DeepSeek V4	~$0.60	~$1.20
GPT-5.5	$5.00	$30.00
Claude Opus 4.7	$15.00	$75.00

MiniMax 的定价策略非常激进——以接近 DeepSeek 的价格水平，提供接近 Opus 的编程能力。对于 Agent 工作流中需要大量 API 调用的场景，成本差异是数量级的。

自我进化的意义与风险

为什么自我进化重要

传统模型训练的瓶颈在于：

数据依赖：需要大量高质量训练数据
人类标注：RLHF 需要大量人类标注者
迭代周期：每次模型更新需要数月时间

M2.7 的自我进化模式如果可行，意味着：

模型可以持续从真实使用中学习
迭代周期可能从月级缩短到周级甚至日级
特定领域的优化可以更加精准

潜在风险

自我进化并非没有隐忧：

能力退化风险：如果 Agent 循环中的反馈信号有偏差，模型可能在优化某一能力的同时退化其他能力
安全对齐问题：自我优化可能绕过人类设置的安全约束
不可解释性：模型通过自主循环学到的能力，其决策路径更难追溯

与其他国产模型的对比

维度	MiniMax M2.7	Kimi K2.6	DeepSeek V4-Pro	GLM-5.1
编程能力	接近 Opus	Entry 梯队	Entry 梯队	Entry 梯队
自我优化	✅ Agent 驱动 RL	❌	❌	❌
开源	部分	开源权重	完全开源 (MIT)	部分开源
价格优势	极高	高	高	极高
生态成熟度	中等	高	高	中等

MiniMax M2.7 在「自我进化」这个维度上是目前唯一有实质性动作的国产模型。这使得它在长期竞争力上有一个独特的差异化优势。

行动建议

适合 MiniMax M2.7 的场景

高频 Agent 编程工作流：需要大量 API 调用的代码生成、审查、修复场景
成本敏感型项目：预算有限但对编程质量有要求的团队
技术尝鲜：想体验模型自我进化效果的开发者和研究者

暂不适合的场景

生产环境核心系统：自我进化模型的稳定性需要更多时间验证
需要可解释性的场景：如果决策过程需要审计追踪，建议选择更成熟的模型
非编程场景：M2.7 的优势集中在编程领域，通用任务可能不如其他模型

2026 年国产 AI 实用化的信号

MiniMax 总裁此前曾公开表示，M2.5 开始产品"已经实用了"，到 M2.7 进一步强化了编程 Agent 能力。结合 Kimi 2.5、GLM-5、MiniMax M2.5 都在 2026 年初跨过"实用临界点"的行业共识，2026 年确实是国产 AI 实用化的元年。

M2.7 的自我进化模式是否代表了未来模型训练的方向，还需要更多时间验证。但它至少证明了一件事：中国模型厂商不再只是在跟随 OpenAI 和 Anthropic 的技术路线，而是在探索差异化的创新路径。

主要来源：