MiMo-V2.5 実測：4 時間ノンストップで"macOS"を構築、ファジー指令理解の実力は？

小米 MiMo-V2.5 シリーズは今朝正式にオープンソース化されました。パラメータとベンチマークはすでにオンラインにあります。この記事は数字を積み上げるのではなく、一つの質問に答えます：

オープンソースモデルは、実際の場面でクローズドソースモデルの代わりになれるのか？

3 つの次元でテストしました：長周期プログラミング、ファジー指令理解、音声能力。結論から言うと——使えます。そして一部の場面では予想より良い結果を出しました。

長周期プログラミング：4 時間ノンストップ、672 回のツール呼び出し

テスト 1：コンパイラを一から構築（北京大学 SysY プロジェクト）

テスト 2：4 時間で macOS デスクトップシステムを複製

React 18 + TypeScript + Zustand + Tailwind CSS + Vite、68 コンポーネントで 54 のネイティブアプリをサポート。4 時間、中断なし、人間のテイクオーバーなし。

与えた条件はただ一行：

山野風のヒーリング系ウェブサイトを作って、旅行手帳のように、自然で静かで呼吸感がある、都会を逃れて荒野に入る感じ。

配色なし、フォントなし、レイアウトなし、アニメーション仕様なし。MiMo-V2.5 の理解と出力：

同等の Agent 能力で、MiMo の Token 消費は競合より 40%-60% 少ない。

今すぐ使うべき：

もう少し観察すべき：