График выпуска серии DeepSeek V4 вызвал немало вопросов — модель была готова, так зачем потребовалась задержка в несколько недель? Аккаунт в соцсетях, связанный с CCTV, даёт ответ: это не техническая задержка, а стратегический выбор. DeepSeek сознательно отложила релиз для глубокой интеграции с экосистемой китайских отечественных чипов.
Что произошло
DeepSeek V4 Pro достиг показателей GPT-5.2 на бенчмарке FoodTruck Bench, при этом стоимость инференса составляет всего 1/17 от американского аналога. Это первая китайская модель, достигшая уровня передовых моделей в этом тесте.
Ключевые данные:
| Параметр | DeepSeek V4 Pro | GPT-5.2 | Разница |
|---|---|---|---|
| FoodTruck Bench | На уровне | Базовый | 0 |
| Стоимость инференса | $0.11/млн токенов | ~$1.87/млн токенов | В 17 раз дешевле |
| Сроки выпуска | Задержка 10 недель | Нормальный график | Стратегическая задержка |
| Совместимость с чипами | Приоритет отечественным | Исключительно NVIDIA | Расходящиеся пути |
Ещё более примечательна стратегия ценообразования API: до 31 мая серия DeepSeek V4 предлагается со скидкой 75% на все тарифы, входные токены — всего $0.11/млн. По этой цене у модели практически нет конкурентов среди открытых моделей.
Почему задержка на 10 недель?
Reuters, ссылаясь на аккаунт CCTV, сообщает, что задержка выпуска DeepSeek V4 указывает на явный стратегический сдвиг: более глубокую интеграцию с экосистемой отечественных чипов Китая.
Это не просто лозунг «поддержим отечественное», а конкретное инженерное решение:
- Безопасность вычислительной цепочки поставок: Экспортные ограничения США на высокопроизводительные GPU ужесточаются, и модели, зависящие от чипов NVIDIA, подвергаются рискам разрыва поставок
- Реструктуризация затрат: Закупка и обслуживание отечественных чипов обходятся значительно дешевле импортных GPU, а ценовое преимущество на стороне инференса напрямую передаётся пользователям
- Привязка к экосистеме: Глубокая адаптация модели к чипу означает более высокую эффективность и более низкую задержку, создавая положительную петлю обратной связи
Иными словами, DeepSeek обменяла 10 недель на критически важную способность: работать на отечественных чипах с производительностью, эквивалентной американским моделям, при стоимости в 17 раз ниже.
Оценка ландшафта
Соревнование ИИ между США и Китаем смещается от «разрыва в способности моделей» к «разрыву в вычислительных экосистемах».
Путь США: GPU NVIDIA + закрытые модели + облачные сервисы с премиальными ценами. Преимущество: лидирующая производительность, зрелые инструментальные цепочки. Недостаток: высокая стоимость, ограничения поставок оборудования.
Путь Китая: Отечественные чипы + открытые модели + дешёвые API. Преимущество: крайне низкая стоимость, автономность цепочки поставок. Недостаток: экосистема инструментов всё ещё формируется, узнаваемость на международном рынке有待提升.
Сигнал DeepSeek V4 Pro ясен: китайские открытые модели идут по маршруту «выравнивание производительности + доминирование по стоимости». Результаты FoodTruck Bench доказывают, что разрыв в производительности сократился до уровня 10 недель, а 17-кратная разница в стоимости — главное оружие для коммерциализации.
Как использовать
| Сценарий | Рекомендация |
|---|---|
| Масштабные вызовы API (обработка логов, пакетный перевод) | DeepSeek V4 Pro API по $0.11/млн токенов — первый выбор, особенно со скидкой 75% |
| Сценарии с конфиденциальными данными | Открытая версия доступна на Hugging Face (лицензия MIT), можно развернуть на серверах с отечественными чипами |
| Бэкенд для агентов | Контекстное окно 1M + низкая стоимость, идеально в качестве основной модели для агентов |
| Сравнительное тестирование | Запустите FoodTruck Bench или SWE-bench для сравнения с GPT-5.2 бок о бок |
Три оценки
Прирост: Выравнивание с GPT-5.2 на FoodTruck Bench + 17-кратное преимущество в стоимости + стратегический поворот к отечественным чипам — три измерения новой информации.
Шум: 10-недельная задержка может также включать факторы оптимизации обучения, а не только адаптацию к чипам. Сам FoodTruck Bench не является самым распространённым бенчмарком в индустрии; для комплексной оценки следует использовать SWE-bench, MMLU и другие.
Сигнал: 17-кратную разницу в стоимости невозможно объяснить краткосрочными акциями. Когда производительность моделей выравнивается, а стоимость отличается на порядок, коммерческий ландшафт быстро изменится.
Источники: Reuters - DeepSeek V4 China Chips | Отчёт CCTV | DeepSeek API