小米 MiMo-V2.5-Pro 评测：开源模型跻身 Arena 全球前六的底气

2026 年 4 月 23 日，小米发布了 MiMo-V2.5 系列全模态大模型，包含 V2.5（通用版）和 V2.5-Pro（旗舰版）。一个月后，该模型在 Chatbot Arena 上的成绩证实了小米在大模型领域的投入已经进入第一梯队。

Arena 成绩

根据 LMSYS Chatbot Arena 的公开数据和小米官方披露：

这些成绩意味着 MiMo-V2.5-Pro 在真实用户对话中的表现，已经超过了 GPT-5.5（Arena 文字榜第七）和绝大多数闭源模型。

MiMo-V2.5-Pro 的关键特性集中在三个方向：

智能体（Agent）能力。 Agent 专项指数开源第一说明该模型在工具调用、多步骤任务规划和自主执行方面有显著优势。这与小米在 IoT 生态中积累的 Agent 开发经验有关——智能家居场景天然需要模型具备多设备协调和长流程执行的能力。

百万级长文本处理。 支持 100 万+ token 的上下文窗口，对于代码库分析、法律文档审查、长视频字幕理解等场景非常实用。在同等基准分数下，MiMo-V2.5-Pro 的 token 使用效率相对较低，意味着达到相同输出质量所需的计算量更少。

全模态覆盖。 MiMo-V2.5 系列包含文本、语音（V2.5-TTS Series）等多个模态，是少有一站式覆盖多模态的开源模型系列。

小米宣布 MiMo-V2.5 系列已适配几乎所有国产推理芯片，这对于国内企业用户来说是一个重要的可用性指标。这意味着模型可以在不依赖英伟达 GPU 的情况下部署，降低了供应链风险和部署成本。

此外，小米已官宣该系列即将开源。考虑到小米在硬件和 IoT 领域的生态整合能力，MiMo-V2.5-Pro 一旦全面开源，很可能在端侧部署和 IoT Agent 场景中获得快速采用。

维度	MiMo-V2.5-Pro	Qwen3.6-35B-A3B	GLM-5.1
Arena 文字	全球第六 / 开源第一	未进入 Top 10	未进入 Top 10
代码能力	中等	SWE-bench 接近 Claude 4.5	Arena 代码榜第五
长上下文	百万+ token	百万+ token	未明确
多模态	文本 + 语音	文本为主	文本为主
国产芯片适配	几乎全覆盖	部分支持	未明确

MiMo-V2.5-Pro 的差异化在于 Agent 能力和生态适配，而不是纯粹的基准分数。如果你需要一个能跑在国产芯片上、能处理长文本、能协调多设备任务的开源模型，它是目前最好的选择之一。

主要来源：