В лагере open-source LLM модель уровня 1T параметров под лицензией MIT, ориентированная на Agent-задачи — это ещё один вариант, который разработчики могут сразу поставить в продакшн.
28 апреля Xiaomi официально открыла код серии MiMo-V2.5 с двумя моделями: Pro-версия — 1.02T общих параметров (42B активных), стандартная — 310B общих (15B активных). Веса, токенизатор и карточки моделей опубликованы на Hugging Face под лицензией MIT — коммерческое использование, продолжение обучения и файн-тюнинг разрешены без дополнительных согласований.
Фокус: Agent, а не универсальный чат
Стратегия MiMo-V2.5 ясна: вместо конкуренции с GPT и Claude по всем направлениям通用-чата, фокус на Agent-сценариях — генерация кода, использование инструментов, многошаговое рассуждение.
MiMo-V2.5-Pro на Agent-бенчмарках:
- SWE-bench Pro: 57.2, приближается к Claude Opus 4.6
- Claw-Eval: 63.8
- τ3-Bench: 72.9
MiMo-V2.5 (310B) набирает 49 баллов в Artificial Analysis Intelligence Index, на уровне GPT-5.5 mini x-high и Grok 4.2. Pro-версия — 54 балла, на уровне GPT-5.3 Codex и Kimi K2.6.
Примечательно, что при выполнении одинаковых Agent-задач Pro-версия потребляет на 40%-60% меньше токенов, чем сопоставимые модели. Этот показатель практичнее сырых бенчмарков — при том же бюджете вычислений можно выполнить больше циклов задач.
Xiaomi и её AI-ритм
Xiaomi не была самым агрессивным игроком в больших моделях, но этот релиз отправляет несколько сигналов.
Во-первых, pre-train возможности domestic-команд больше не догоняют — они конкурируют. Pro-версия на SWE-bench Pro сравнялась с Claude Opus 4.6.
Во-вторых, выбор MIT вместо Apache 2.0 или коммерческой лицензии снижает психологический барьер для коммерческого внедрения. Для предприятий, нуждающихся в локальном развёртывании с сохранением данных, это кандидат в шорт-лист.
В-третьих, программа MiMo Orbit «100 триллионов токенов» даёт разработчикам API-квоту — не деньги, а вычисления. Это стратегия ранних облачных провайдеров: пусть разработчики начнут пользоваться, сформируют зависимость, а бизнес-модель придёт потом.
Кому стоит обратить внимание, кому можно подождать
Стоит попробовать сейчас:
- Команды, строящие Agent-системы — нужен open-source baseline для сравнения
- Есть GPU-ресурсы (мульти-A100/H100) и нужен 1M контекст
- Стартапы, которым нужна свобода MIT-лицензии
Можно подождать:
- Реальные требования к VRAM и скорость инференса
- Китайская языковая способность — бенчмарки на английском
- Будет ли Xiaomi продолжать итерации — один релиз не создаёт экосистему