小米 MiMo-V2.5-Pro 评测:开源模型跻身 Arena 全球前六的底气

小米 MiMo-V2.5-Pro 评测:开源模型跻身 Arena 全球前六的底气

2026 年 4 月 23 日,小米发布了 MiMo-V2.5 系列全模态大模型,包含 V2.5(通用版)和 V2.5-Pro(旗舰版)。一个月后,该模型在 Chatbot Arena 上的成绩证实了小米在大模型领域的投入已经进入第一梯队。

Arena 成绩

根据 LMSYS Chatbot Arena 的公开数据和小米官方披露:

  • Arena 文字榜全球第六(约 1489 分区间),是排名最高的开源模型
  • Agent 专项指数开源第一,在所有大模型中跻身前五
  • 全球开源大模型综合智能指数并列第一

这些成绩意味着 MiMo-V2.5-Pro 在真实用户对话中的表现,已经超过了 GPT-5.5(Arena 文字榜第七)和绝大多数闭源模型。

核心能力

MiMo-V2.5-Pro 的关键特性集中在三个方向:

智能体(Agent)能力。 Agent 专项指数开源第一说明该模型在工具调用、多步骤任务规划和自主执行方面有显著优势。这与小米在 IoT 生态中积累的 Agent 开发经验有关——智能家居场景天然需要模型具备多设备协调和长流程执行的能力。

百万级长文本处理。 支持 100 万+ token 的上下文窗口,对于代码库分析、法律文档审查、长视频字幕理解等场景非常实用。在同等基准分数下,MiMo-V2.5-Pro 的 token 使用效率相对较低,意味着达到相同输出质量所需的计算量更少。

全模态覆盖。 MiMo-V2.5 系列包含文本、语音(V2.5-TTS Series)等多个模态,是少有一站式覆盖多模态的开源模型系列。

生态适配

小米宣布 MiMo-V2.5 系列已适配几乎所有国产推理芯片,这对于国内企业用户来说是一个重要的可用性指标。这意味着模型可以在不依赖英伟达 GPU 的情况下部署,降低了供应链风险和部署成本。

此外,小米已官宣该系列即将开源。考虑到小米在硬件和 IoT 领域的生态整合能力,MiMo-V2.5-Pro 一旦全面开源,很可能在端侧部署和 IoT Agent 场景中获得快速采用。

与同类模型对比

维度MiMo-V2.5-ProQwen3.6-35B-A3BGLM-5.1
Arena 文字全球第六 / 开源第一未进入 Top 10未进入 Top 10
代码能力中等SWE-bench 接近 Claude 4.5Arena 代码榜第五
长上下文百万+ token百万+ token未明确
多模态文本 + 语音文本为主文本为主
国产芯片适配几乎全覆盖部分支持未明确

MiMo-V2.5-Pro 的差异化在于 Agent 能力和生态适配,而不是纯粹的基准分数。如果你需要一个能跑在国产芯片上、能处理长文本、能协调多设备任务的开源模型,它是目前最好的选择之一。

适用场景与建议

  • IoT / 智能家居开发: MiMo-V2.5-Pro 的 Agent 能力和小米生态整合是天然优势。
  • 国产芯片部署团队: 适配覆盖面广,降低了硬件依赖。
  • 长文档处理: 百万 token 上下文 + 高效 token 使用,适合法律、金融等需要大量上下文分析的场景。
  • 通用 AI 应用: Arena 成绩证明其在通用对话能力上已经达到第一梯队,可作为 Claude/GPT 的平替方案。

主要来源: