核心的な見解
2026年4月は、中国のLLMベンダーにとって「一斉進化の月」となりました。月初のGLM 5.1がプログラミング能力で鮮烈な幕開けを見せ、中旬にはXiaomiのmimo v2.5シリーズがオープンソース化され、月末にはDeepSeek V4が1兆パラメータ規模のMoEアーキテクチャで発表のトリを飾りました。これにより、国産モデル間の性能差はわずか1か月で劇的に縮まりました。LM Arenaの最新データでは、文心5.1 Previewが国産1位・世界13位を堅持し、DeepSeek V4 Proが23位、Xiaomi mimo-v2.5-proが22位にランクイン。国産モデルが初めて、同一時期に複数モデルを世界トップ25に送り込んだことになります。
4月の主要リリースタイムライン
| 日付 | モデル/イベント | 主な特徴 |
|---|---|---|
| 4月上旬 | 智譜 GLM 5.1 | プログラミング能力がentryレベルに到達。体感評価はKimi K2.6と同等 |
| 4月中旬 | 月之暗面 Kimi K2.6 オープンソース化 | プログラミングモデルのOSS化が業界に衝撃を与え、マルチモデルAgent能力が突出 |
| 4月下旬 | Xiaomi mimo v2.5 シリーズ | OSS化 + 多言語・方言ASR + トークン効率の最適化 |
| 4月30日 | DeepSeek V4 Pro 期間限定75%割引 | 1兆パラメータMoEモデルのAPI価格が過去最低水準に |
| 5月1日 | 月之暗面 Kimi K3 正式発表 | 2.5兆パラメータ規模。Q3リリース予定。国際トップモデルに正面から対抗 |
| 継続中 | 文心 5.1 Preview | LM Arenaにて国産1位・世界13位を維持 |
実使用評価マトリックス
複数の独立開発者によるクロス検証に基づくもので、公式ベンチマークではありませんが、実際のユースケースにおける順位を反映しています:
| レベル | モデル | 代表的なユースケースでの性能 |
|---|---|---|
| Entry 以上 | GLM 5.1 ≈ Kimi K2.6 | 複雑なコーディングタスク、長文脈推論 |
| Entry 以上 | DeepSeek V4 Pro | コスパが最も優れた大規模パラメータモデル |
| Entry 以下 | Qwen 3.6 Max Preview | 総合能力はバランスが良いが、プログラミングでやや劣る |
| Entry 以下 | mimo v2.5 Pro > Qwen 3.6 Plus | 特定シナリオで良好な性能を発揮 |
勢力図の変化に関する考察
第1層で「4+1」の構図が形成されつつある:GLM 5.1、Kimi K2.6、DeepSeek V4 Pro、文心5.1 Previewの4モデルがプログラミングと総合能力において同一グレードに入り、さらに追撃するXiaomi mimo v2.5 Proを加え、国産モデル間の「世代格差」は消失しつつあります。
オープンソース戦略の明確な分化:Kimi K2.6とXiaomi mimo v2.5はオープンソース路線を選択する一方、GLM 5.1と文心5.1は引き続きAPI/クラウドサービス中心を維持しています。DeepSeekはV4 Proにおいて「期間限定割引」戦略を採用し、開発者の試用を促進しています。
K3の野心:月之暗面はK2.6のオープンソース化の余勢を駆って、そのままK3を公式発表しました。2.5兆パラメータ規模は、「小型モデルの高効率化」という差別化路線を放棄し、国際トップモデルとのパラメータ競争に正面から挑む姿勢を示しています。
アクション推奨事項
- プログラミング用途の推奨:GLM 5.1またはKimi K2.6(体感評価ともにentryレベル入り)
- コスパ重視の選択:DeepSeek V4 Proの期間限定75%割引期間(~5月5日/5月31日)は、1兆MoEモデルを最低コストで体験できる貴重な機会です。
- K3に注目:Q3リリース後、国産モデルの勢力図が再び塗り替えられる可能性があります。動向を注視することをお勧めします。
- オープンソースエコシステム:mimo v2.5シリーズのオープンソース戦略は要注目です。特にトークン効率の最適化は、エッジデプロイメントにおいて参考になるでしょう。