Xiaomi MiMo-V2.5 две модели с открытым кодом: 1T параметров, 1M контекст, лицензия MIT

В лагере open-source LLM модель уровня 1T параметров под лицензией MIT, ориентированная на Agent-задачи — это ещё один вариант, который разработчики могут сразу поставить в продакшн.

28 апреля Xiaomi официально открыла код серии MiMo-V2.5 с двумя моделями: Pro-версия — 1.02T общих параметров (42B активных), стандартная — 310B общих (15B активных). Веса, токенизатор и карточки моделей опубликованы на Hugging Face под лицензией MIT — коммерческое использование, продолжение обучения и файн-тюнинг разрешены без дополнительных согласований.

Фокус: Agent, а не универсальный чат

Стратегия MiMo-V2.5 ясна: вместо конкуренции с GPT и Claude по всем направлениям通用-чата, фокус на Agent-сценариях — генерация кода, использование инструментов, многошаговое рассуждение.

MiMo-V2.5-Pro на Agent-бенчмарках:

SWE-bench Pro: 57.2, приближается к Claude Opus 4.6
Claw-Eval: 63.8
τ3-Bench: 72.9

MiMo-V2.5 (310B) набирает 49 баллов в Artificial Analysis Intelligence Index, на уровне GPT-5.5 mini x-high и Grok 4.2. Pro-версия — 54 балла, на уровне GPT-5.3 Codex и Kimi K2.6.

Примечательно, что при выполнении одинаковых Agent-задач Pro-версия потребляет на 40%-60% меньше токенов, чем сопоставимые модели. Этот показатель практичнее сырых бенчмарков — при том же бюджете вычислений можно выполнить больше циклов задач.

Xiaomi и её AI-ритм

Xiaomi не была самым агрессивным игроком в больших моделях, но этот релиз отправляет несколько сигналов.

Во-первых, pre-train возможности domestic-команд больше не догоняют — они конкурируют. Pro-версия на SWE-bench Pro сравнялась с Claude Opus 4.6.

Во-вторых, выбор MIT вместо Apache 2.0 или коммерческой лицензии снижает психологический барьер для коммерческого внедрения. Для предприятий, нуждающихся в локальном развёртывании с сохранением данных, это кандидат в шорт-лист.

В-третьих, программа MiMo Orbit «100 триллионов токенов» даёт разработчикам API-квоту — не деньги, а вычисления. Это стратегия ранних облачных провайдеров: пусть разработчики начнут пользоваться, сформируют зависимость, а бизнес-модель придёт потом.

Кому стоит обратить внимание, кому можно подождать

Стоит попробовать сейчас:

Команды, строящие Agent-системы — нужен open-source baseline для сравнения
Есть GPU-ресурсы (мульти-A100/H100) и нужен 1M контекст
Стартапы, которым нужна свобода MIT-лицензии

Можно подождать:

Реальные требования к VRAM и скорость инференса
Китайская языковая способность — бенчмарки на английском
Будет ли Xiaomi продолжать итерации — один релиз не создаёт экосистему

Фокус: Agent, а не универсальный чат

Xiaomi и её AI-ритм

Кому стоит обратить внимание, кому можно подождать

Основные источники

Похожие материалы

Исследование реальной стоимости AI-моделей: низкая цена не означает дешевизну

Битва моделей апреля 2026: нет универсального чемпиона, есть победители по сценариям

Цены на кэширование ввода DeepSeek API снижены до 1/10: ценовая война выходит на новый этап