C
ChaoBro

DeepSeek V4 в отчёте NIST подтверждает уровень GPT-5: китайские модели догоняют американский топ за 8 месяцев

DeepSeek V4 в отчёте NIST подтверждает уровень GPT-5: китайские модели догоняют американский топ за 8 месяцев

Вывод: Разрыв между американскими и китайскими моделями количественно оценивается и отслеживается

Ключевой вывод в последнем отчёте об оценке моделей ИИ от Национального института стандартов и технологий США (NIST) привлёк внимание отрасли: DeepSeek V4 по нескольким ключевым бенчмаркам достиг уровня GPT-5, выпущенного 8 месяцев назад.

Это не односторонний вывод какой-либо оценочной организации, а независимая оценка официального технического учреждения США. При сохранении текущей тенденции отчёт прогнозирует, что китайские модели могут достичь уровня GPT-5.5 (примерно уровня Mythos) к февралю 2027 года.

Разбор бенчмарков

Сравнение NIST по ключевым измерениям:

ИзмерениеDeepSeek V4GPT-5 (8 месяцев назад)Разрыв
Общие рассужденияБлизкоБазовый≈ Наравне
Генерация кодаБлизкоБазовый≈ Наравне
Математические рассужденияЧуть нижеБазовый-3 до -5 баллов
Мультимодальное пониманиеЗначительно отстаётБазовый-8 до -10 баллов
Длинный контекстБлизкоБазовый≈ Наравне
Китайский языкЗначительно впередиПреимущество китайской модели

Ключевой вывод: В двух самых практических измерениях — общие рассуждения и генерация кода — DeepSeek V4 уже догнал GPT-5. Разрыв сосредоточен в мультимодальном понимании, что именно является конструктивным компромиссом DeepSeek V4 (фокус на эффективности текстовых рассуждений).

Тенденция догоняющего роста: Предсказуемая временная шкала

Отчёт предоставляет заслуживающую внимания экстраполяцию:

2025.09 — Выпуск GPT-5 (базовый уровень США)
2026.01 — DeepSeek V4 достигает уровня GPT-5 (отставание ~4 месяца)
2026.09 — Выпуск GPT-5.5 (ожидается)
2027.02 — Китайские модели достигают уровня GPT-5.5 (ожидаемое отставание ~5 месяцев)

Если эта тенденция точна, это означает:

  1. Скорость догоняющего роста ускоряется: От начального отставания моделей в 12-18 месяцев сократилось до 4-5 месяцев
  2. Разрыв сокращается, но не исчезнет: Американские модели сохраняют преимущество в один цикл итерации
  3. Огромное преимущество цена/качество: Китайские модели обеспечивают близкие возможности при значительно меньшей стоимости

Различия в технических путях

Догоняющий рост DeepSeek V4 был достигнут не за счёт «бросания вычислительных ресурсов», а через другой технический путь:

СравнениеПуть американских моделейПуть DeepSeek
АрхитектураПлотный TransformerРазреженный MoE (смесь экспертов)
Стратегия обученияМассивные данные + постобучениеЭффективный отбор данных + обучение с подкреплением
Зависимость от вычисленийКластеры из 10 000+ GPU1 000+ GPU, оптимизация эффективности
СтоимостьСотни миллионов за раундЗначительно ниже, чем у американских коллег

Долгосрочные последствия различий в путях:

  • Архитектура MoE DeepSeek активирует только часть параметров во время вывода, более низкие эксплуатационные расходы
  • Плотная архитектура американских моделей может обучаться быстрее, но выше стоимость вывода
  • Если путь MoE окажется устойчивым для догоняющего роста, это может изменить базовую логику глобальной конкуренции в ИИ

Последствия для китайских разработчиков

  • Окно производственного развёртывания открыто: Производительность DeepSeek V4 в общих рассуждениях и генерации кода достаточна для большинства производственных сценариев
  • Мультимодальность остаётся слабостью: Для сильных мультимодальных возможностей нужно ждать модели следующего поколения или комбинировать со специализированными визуальными моделями
  • Ценовое преимущество значительно: В сочетании с 75% ограниченной по времени скидкой DeepSeek V4 Pro (продлена до 31 мая) — это оптимальное окно для развёртывания

Последствия для американских разработчиков

  • Конкурентное давление растёт: Если китайские модели обеспечивают близкие возможности при 1/10 стоимости, ценообразование API столкнётся с долгосрочным нисходящим давлением
  • Архитектура MoE заслуживает внимания: Технический путь DeepSeek может представлять более устойчивое направление развития
  • Не стоит недооценивать скорость догоняющего роста: Разрыв в возможностях 8-месячной давности уже сократился до нуля — что произойдёт в следующие 8 месяцев?

Неопределённости

Экстраполяция отчёта NIST основана на исторических тенденциях, но следующие факторы могут изменить ритм догоняющего роста:

  1. Ограничения вычислений: Догоняющий рост DeepSeek может быть ограничен доступом к чипам высокого класса
  2. Качество данных: Доступ к высококачественным английским данным может стать бутылочным горлышком
  3. Алгоритмические прорывы: Любые архитектурные инновации с любой из сторон могут нарушить текущую тенденцию
  4. Геополитика: Экспортный контроль и изменения политики могут ускорить или замедлить догоняющий рост

Значимость этого отчёта NIST заключается не только в количественной оценке разрыва в возможностях между американскими и китайскими моделями, но, что более важно, в подтверждении тенденции: догоняющий рост китайских моделей сместился с вопроса «смогут ли они догнать» на «сколько времени им понадобится, чтобы догнать».