DeepSeek V4 в отчёте NIST подтверждает уровень GPT-5: китайские модели догоняют американский топ за 8 месяцев

Вывод: Разрыв между американскими и китайскими моделями количественно оценивается и отслеживается

Ключевой вывод в последнем отчёте об оценке моделей ИИ от Национального института стандартов и технологий США (NIST) привлёк внимание отрасли: DeepSeek V4 по нескольким ключевым бенчмаркам достиг уровня GPT-5, выпущенного 8 месяцев назад.

Это не односторонний вывод какой-либо оценочной организации, а независимая оценка официального технического учреждения США. При сохранении текущей тенденции отчёт прогнозирует, что китайские модели могут достичь уровня GPT-5.5 (примерно уровня Mythos) к февралю 2027 года.

Разбор бенчмарков

Сравнение NIST по ключевым измерениям:

Измерение	DeepSeek V4	GPT-5 (8 месяцев назад)	Разрыв
Общие рассуждения	Близко	Базовый	≈ Наравне
Генерация кода	Близко	Базовый	≈ Наравне
Математические рассуждения	Чуть ниже	Базовый	-3 до -5 баллов
Мультимодальное понимание	Значительно отстаёт	Базовый	-8 до -10 баллов
Длинный контекст	Близко	Базовый	≈ Наравне
Китайский язык	Значительно впереди	—	Преимущество китайской модели

Ключевой вывод: В двух самых практических измерениях — общие рассуждения и генерация кода — DeepSeek V4 уже догнал GPT-5. Разрыв сосредоточен в мультимодальном понимании, что именно является конструктивным компромиссом DeepSeek V4 (фокус на эффективности текстовых рассуждений).

Тенденция догоняющего роста: Предсказуемая временная шкала

Отчёт предоставляет заслуживающую внимания экстраполяцию:

2025.09 — Выпуск GPT-5 (базовый уровень США)
2026.01 — DeepSeek V4 достигает уровня GPT-5 (отставание ~4 месяца)
2026.09 — Выпуск GPT-5.5 (ожидается)
2027.02 — Китайские модели достигают уровня GPT-5.5 (ожидаемое отставание ~5 месяцев)

Если эта тенденция точна, это означает:

Скорость догоняющего роста ускоряется: От начального отставания моделей в 12-18 месяцев сократилось до 4-5 месяцев
Разрыв сокращается, но не исчезнет: Американские модели сохраняют преимущество в один цикл итерации
Огромное преимущество цена/качество: Китайские модели обеспечивают близкие возможности при значительно меньшей стоимости

Различия в технических путях

Догоняющий рост DeepSeek V4 был достигнут не за счёт «бросания вычислительных ресурсов», а через другой технический путь:

Сравнение	Путь американских моделей	Путь DeepSeek
Архитектура	Плотный Transformer	Разреженный MoE (смесь экспертов)
Стратегия обучения	Массивные данные + постобучение	Эффективный отбор данных + обучение с подкреплением
Зависимость от вычислений	Кластеры из 10 000+ GPU	1 000+ GPU, оптимизация эффективности
Стоимость	Сотни миллионов за раунд	Значительно ниже, чем у американских коллег

Долгосрочные последствия различий в путях:

Архитектура MoE DeepSeek активирует только часть параметров во время вывода, более низкие эксплуатационные расходы
Плотная архитектура американских моделей может обучаться быстрее, но выше стоимость вывода
Если путь MoE окажется устойчивым для догоняющего роста, это может изменить базовую логику глобальной конкуренции в ИИ

Последствия для китайских разработчиков

Окно производственного развёртывания открыто: Производительность DeepSeek V4 в общих рассуждениях и генерации кода достаточна для большинства производственных сценариев
Мультимодальность остаётся слабостью: Для сильных мультимодальных возможностей нужно ждать модели следующего поколения или комбинировать со специализированными визуальными моделями
Ценовое преимущество значительно: В сочетании с 75% ограниченной по времени скидкой DeepSeek V4 Pro (продлена до 31 мая) — это оптимальное окно для развёртывания

Последствия для американских разработчиков

Конкурентное давление растёт: Если китайские модели обеспечивают близкие возможности при 1/10 стоимости, ценообразование API столкнётся с долгосрочным нисходящим давлением
Архитектура MoE заслуживает внимания: Технический путь DeepSeek может представлять более устойчивое направление развития
Не стоит недооценивать скорость догоняющего роста: Разрыв в возможностях 8-месячной давности уже сократился до нуля — что произойдёт в следующие 8 месяцев?

Неопределённости

Экстраполяция отчёта NIST основана на исторических тенденциях, но следующие факторы могут изменить ритм догоняющего роста:

Ограничения вычислений: Догоняющий рост DeepSeek может быть ограничен доступом к чипам высокого класса
Качество данных: Доступ к высококачественным английским данным может стать бутылочным горлышком
Алгоритмические прорывы: Любые архитектурные инновации с любой из сторон могут нарушить текущую тенденцию
Геополитика: Экспортный контроль и изменения политики могут ускорить или замедлить догоняющий рост

Значимость этого отчёта NIST заключается не только в количественной оценке разрыва в возможностях между американскими и китайскими моделями, но, что более важно, в подтверждении тенденции: догоняющий рост китайских моделей сместился с вопроса «смогут ли они догнать» на «сколько времени им понадобится, чтобы догнать».

Вывод: Разрыв между американскими и китайскими моделями количественно оценивается и отслеживается

Разбор бенчмарков

Тенденция догоняющего роста: Предсказуемая временная шкала

Различия в технических путях

Последствия для китайских разработчиков

Последствия для американских разработчиков

Неопределённости

Похожие материалы

17 дней, 4 модели: гонка вооружений китайского ИИ с открытым кодом и перекройка ландшафта производительности

Hermes Agent vs OpenClaw: Как выбрать правильный фреймворк AI-агентов в 2026 году?

Загрузки Codex碾压 Claude Code: экосистемическая битва OpenAI с функцией «Migrate to Codex»