MiniMax M2.7: модель, которая обучает сама себя

MiniMax M2.7: модель, которая обучает сама себя

Главный вывод

MiniMax M2.7 — не просто модель с большим количеством параметров. Ключевая инновация: модель активно участвует в собственной тренировке через сложные Agent Harness для RL, достигая «самообучения».

Технические детали

ПараметрОписание
Парадигма обученияAgent Harness-управляемое самообучение через RL
КодированиеSWE-Pro приближается к Opus
Agent-способностиСложные многошаговые Agent-воркфлоу
ЦенаВход 2.1 юаня/миллион токенов (~$0.3)
APIСовместим с OpenAI

Сравнение

МодельSWE-ProЦена (вход/млн токенов)Соотношение
Claude Opus 4.7Базовая~$15-751.0x
MiniMax M2.7Приближается к Opus~$0.350x+
DeepSeek V4 ProОтлично~$0.5527x

Рекомендации

Подходит для

  • SWE-задачи: баг-фиксы, рефакторинг, реализация функций
  • Agent-воркфлоу: многошаговое рассуждение и вызов инструментов
  • Проекты с ограниченным бюджетом

Не подходит для

  • Творческое письмо: M2.7 оптимизирован для кодинга
  • Safety-критичные приложения: интерпретируемость самообучения требует проверки

Перспектива

Маршрут «самообучения» MiniMax M2.7 может стать ключевым направлением во второй половине 2026 года. Для разработчиков — отличный момент для тестирования near-Opus кодинга по минимальной цене.