Вывод: Разрыв между американскими и китайскими моделями количественно оценивается и отслеживается
Ключевой вывод в последнем отчёте об оценке моделей ИИ от Национального института стандартов и технологий США (NIST) привлёк внимание отрасли: DeepSeek V4 по нескольким ключевым бенчмаркам достиг уровня GPT-5, выпущенного 8 месяцев назад.
Это не односторонний вывод какой-либо оценочной организации, а независимая оценка официального технического учреждения США. При сохранении текущей тенденции отчёт прогнозирует, что китайские модели могут достичь уровня GPT-5.5 (примерно уровня Mythos) к февралю 2027 года.
Разбор бенчмарков
Сравнение NIST по ключевым измерениям:
| Измерение | DeepSeek V4 | GPT-5 (8 месяцев назад) | Разрыв |
|---|---|---|---|
| Общие рассуждения | Близко | Базовый | ≈ Наравне |
| Генерация кода | Близко | Базовый | ≈ Наравне |
| Математические рассуждения | Чуть ниже | Базовый | -3 до -5 баллов |
| Мультимодальное понимание | Значительно отстаёт | Базовый | -8 до -10 баллов |
| Длинный контекст | Близко | Базовый | ≈ Наравне |
| Китайский язык | Значительно впереди | — | Преимущество китайской модели |
Ключевой вывод: В двух самых практических измерениях — общие рассуждения и генерация кода — DeepSeek V4 уже догнал GPT-5. Разрыв сосредоточен в мультимодальном понимании, что именно является конструктивным компромиссом DeepSeek V4 (фокус на эффективности текстовых рассуждений).
Тенденция догоняющего роста: Предсказуемая временная шкала
Отчёт предоставляет заслуживающую внимания экстраполяцию:
2025.09 — Выпуск GPT-5 (базовый уровень США)
2026.01 — DeepSeek V4 достигает уровня GPT-5 (отставание ~4 месяца)
2026.09 — Выпуск GPT-5.5 (ожидается)
2027.02 — Китайские модели достигают уровня GPT-5.5 (ожидаемое отставание ~5 месяцев)
Если эта тенденция точна, это означает:
- Скорость догоняющего роста ускоряется: От начального отставания моделей в 12-18 месяцев сократилось до 4-5 месяцев
- Разрыв сокращается, но не исчезнет: Американские модели сохраняют преимущество в один цикл итерации
- Огромное преимущество цена/качество: Китайские модели обеспечивают близкие возможности при значительно меньшей стоимости
Различия в технических путях
Догоняющий рост DeepSeek V4 был достигнут не за счёт «бросания вычислительных ресурсов», а через другой технический путь:
| Сравнение | Путь американских моделей | Путь DeepSeek |
|---|---|---|
| Архитектура | Плотный Transformer | Разреженный MoE (смесь экспертов) |
| Стратегия обучения | Массивные данные + постобучение | Эффективный отбор данных + обучение с подкреплением |
| Зависимость от вычислений | Кластеры из 10 000+ GPU | 1 000+ GPU, оптимизация эффективности |
| Стоимость | Сотни миллионов за раунд | Значительно ниже, чем у американских коллег |
Долгосрочные последствия различий в путях:
- Архитектура MoE DeepSeek активирует только часть параметров во время вывода, более низкие эксплуатационные расходы
- Плотная архитектура американских моделей может обучаться быстрее, но выше стоимость вывода
- Если путь MoE окажется устойчивым для догоняющего роста, это может изменить базовую логику глобальной конкуренции в ИИ
Последствия для китайских разработчиков
- Окно производственного развёртывания открыто: Производительность DeepSeek V4 в общих рассуждениях и генерации кода достаточна для большинства производственных сценариев
- Мультимодальность остаётся слабостью: Для сильных мультимодальных возможностей нужно ждать модели следующего поколения или комбинировать со специализированными визуальными моделями
- Ценовое преимущество значительно: В сочетании с 75% ограниченной по времени скидкой DeepSeek V4 Pro (продлена до 31 мая) — это оптимальное окно для развёртывания
Последствия для американских разработчиков
- Конкурентное давление растёт: Если китайские модели обеспечивают близкие возможности при 1/10 стоимости, ценообразование API столкнётся с долгосрочным нисходящим давлением
- Архитектура MoE заслуживает внимания: Технический путь DeepSeek может представлять более устойчивое направление развития
- Не стоит недооценивать скорость догоняющего роста: Разрыв в возможностях 8-месячной давности уже сократился до нуля — что произойдёт в следующие 8 месяцев?
Неопределённости
Экстраполяция отчёта NIST основана на исторических тенденциях, но следующие факторы могут изменить ритм догоняющего роста:
- Ограничения вычислений: Догоняющий рост DeepSeek может быть ограничен доступом к чипам высокого класса
- Качество данных: Доступ к высококачественным английским данным может стать бутылочным горлышком
- Алгоритмические прорывы: Любые архитектурные инновации с любой из сторон могут нарушить текущую тенденцию
- Геополитика: Экспортный контроль и изменения политики могут ускорить или замедлить догоняющий рост
Значимость этого отчёта NIST заключается не только в количественной оценке разрыва в возможностях между американскими и китайскими моделями, но, что более важно, в подтверждении тенденции: догоняющий рост китайских моделей сместился с вопроса «смогут ли они догнать» на «сколько времени им понадобится, чтобы догнать».