Вывод
В апреле 2026 года открытые модели достигли исторического прорыва: Kimi K2.6 от Moonshot AI обошёл Claude Opus 4.7 на LiveBench.
LiveBench известен постоянным обновлением тестовых вопросов, предотвращая завышенные оценки через запоминание данных обучения.
Сравнение данных
| Измерение | Kimi K2.6 | Claude Opus 4.7 | Разница |
|---|---|---|---|
| LiveBench | Победа | Базовый | K2.6 лидирует |
| SWE-Bench | ~80% | 87.6% | ~7.6pp отставание |
| Входная цена | $0.80-0.95 | $5.00 | K2.6 в 5-6 раз дешевле |
| Выходная цена | $3.60-4.00 | $25.00 | K2.6 в 6-7 раз дешевле |
Рекомендации
- Команды с ограниченным бюджетом: Kimi K2.6 — самая рентабельная флагманская открытая модель
- Кодирование: Claude Opus 4.7 всё ещё лидирует по SWE-Bench, но разрыв сокращается