Kimi K2.6 обходит Opus 4.7 на LiveBench: эпоха открытых моделей, бросающих вызов закрытым флагманам

Kimi K2.6 обходит Opus 4.7 на LiveBench: эпоха открытых моделей, бросающих вызов закрытым флагманам

Вывод

В апреле 2026 года открытые модели достигли исторического прорыва: Kimi K2.6 от Moonshot AI обошёл Claude Opus 4.7 на LiveBench.

LiveBench известен постоянным обновлением тестовых вопросов, предотвращая завышенные оценки через запоминание данных обучения.

Сравнение данных

ИзмерениеKimi K2.6Claude Opus 4.7Разница
LiveBenchПобедаБазовыйK2.6 лидирует
SWE-Bench~80%87.6%~7.6pp отставание
Входная цена$0.80-0.95$5.00K2.6 в 5-6 раз дешевле
Выходная цена$3.60-4.00$25.00K2.6 в 6-7 раз дешевле

Рекомендации

  • Команды с ограниченным бюджетом: Kimi K2.6 — самая рентабельная флагманская открытая модель
  • Кодирование: Claude Opus 4.7 всё ещё лидирует по SWE-Bench, но разрыв сокращается