MiniMaxのモデル更新リズムは物静かだが、M2.7今回の変化はもう一度見る価値がある。
MiniMax公式网站首页のカルーセルで、M2.7の紹介文はM2.5時代の「コードと推論の強化」から2つの文にアップグレードされた:
Enable Self-Improvement for Models, with Significant Improvement in Practical Capabilities Compared to M2.5
キーワードは「Self-Improvement」——モデルの自己進化。これは単なるバージョン番号+0.2ではなく、MiniMaxのモデルトレーニング方法における方向性の変化だ。
M2.7の4つの能力次元
公式サイト情報から、M2.7の能力アップグレードは4つのシナリオをカバー:
Agent Harness能力:自己進化するAgent harnessの構築をサポート。これはモデルが実行中にフィードバックに基づいて自己調整できることを意味し、毎回手動で再トレーニングやファインチューニングする必要がなくなる。
エンジニアリングコーディング能力:公式の説明は「A model that truly understands production systems」。これはM2.7のコード理解が「コードスニペットを書ける」だけでなく、プロジェクトレベルのコード構造、依存関係、エンジニアリングプラクティスを理解できることを示唆している。
オフィスシーン:複雑なExcel/Word/PPTタスクと多輪編集を明確にサポート。このシナリオポジショニングは非常に現実的——誰もがAgentにOSカーネルを書かせる必要はないが、多くの人がAgentに複雑なExcel数式を修正してもらう必要がある。
M2.7 vs M2.5:公式はM2.5に直接ベンチマークし、「Practical Capabilities」が大幅に向上したと主張。具体的なベンチマークデータはまだ公開されていない。
国産モデル格付けにおける位置
現在の国産コード能力競争において、各社は差异化ルートを探している:
- 通義千問はオープンソースエコシステムと大規模パラメータルートを進む
- Kimiは長コンテキストと深い思考を主打
- MiniMaxのルートはAgent harness + 実際のエンジニアリングシーンに見える
M2.7の「Self-Improvement」方向が成功すれば、モデルのイテレーション速度は人手の注釈とファインチューニングのサイクルから部分的に脱却できる——コストと時間の次元で意味がある。
ただし、「自己進化」という言葉はAI業界で使いすぎられている。ある会社はオンライン学習を指し、ある会社はフィードバックに基づくRLファインチューニングを指し、ある会社は単によりスマートなpromptを指す。MiniMaxが具体的にどのような技術ルートを使ったか、まだ公式は開示していない。
どう使うか
M2.7はすでにMiniMax APIを通じて呼び出し可能で、MiniMax Agent製品で直接体験できる。API価格ページには、MiniMaxがトークンパッケージと無制限月度プランの2つのモードを提供していると表示されている。
国産モデルの中でオフィスシーン能力の強いオプションを探している開発者にとって、M2.7はQwen、Kimiとの横断比較に値する。
主要情報源: