DeepSeek-V4 выпущен: 1.6 трлн MoE параметров, цена API — 1/7 от Opus

DeepSeek-V4 выпущен: 1.6 трлн MoE параметров, цена API — 1/7 от Opus

Вывод в первую очередь

DeepSeek-V4 — это не постепенное обновление, а прямой вызов существующей системе ценообразования на рынке. 1.6 трлн параметров, активация лишь 37 млрд, контекстное окно 1 млн, открытый исходный код Apache 2.0 — сами по себе эти характеристики впечатляют. Но по-настоящему меняет правила игры цена API: $3.48/млн выходных токенов, что снижает стоимость моделей закрытого типа в 7 раз.

Обзор характеристик

ПоказательDeepSeek-V4GPT-5.5Claude Opus 4.7
Общее количество параметров1.6TНе раскрываетсяНе раскрывается
Активированные параметры~37BНе раскрываетсяНе раскрывается
Контекстное окно1,000,000128,000200,000
Открытый кодApache 2.0ЗакрытыйЗакрытый
Цена ввода$0.35/млн$2.50/млн$15.00/млн
Цена вывода$3.48/млн$30.00/млн$25.00/млн
Скорость инференсаВ 35 раз быстрее (по сравнению с предыдущим поколением)Не раскрываетсяНе раскрывается
Снижение энергопотребления40% (по сравнению с предыдущим поколением)Не раскрываетсяНе раскрывается
МультимодальностьНативная поддержка текста/изображений/видео/аудиоДаДа

Источник: официальный технический отчёт DeepSeek, страницы цен моделей (апрель 2026)

Почему эта цифра важна

Разница в цене — не маргинальная, а на порядок. Когда DeepSeek-V4 Pro стоит всего 14% от Opus 4.7 и 11.6% от GPT-5.5, логика принятия технологических решений на предприятиях фундаментально меняется.

Прежнее обоснование выбора закрытых API было «open source недостаточно хорош» — но данные бенчмарков показывают, что разрыв DeepSeek-V4 с Opus 4.7 в задачах кодирования составляет менее 0.2 балла. Для большинства производственных сценариев этот разрыв в 0.2 балла никак не оправдывает 7-9-кратную ценовую премию.

Разбор архитектуры: почему MoE может быть одновременно большим и быстрым

1.6 трлн параметров DeepSeek-V4 используют архитектуру MoE (Mixture of Experts). Ключевые моменты:

  1. Редкая активация: При каждом инференсе активируется только ~37 млрд параметров — 2.3% от общего числа. Это означает, что реальная стоимость инференса значительно ниже моделей с полным набором параметров.
  2. 16 экспертных маршрутизаторов: Модель содержит несколько специализированных «экспертных» подсетей, автоматически направляющих запрос к наиболее релевантным экспертам.
  3. Контекст 1 млн токенов без потерь: В отличие от многих моделей с «эффективным затуханием контекста», DeepSeek-V4 утверждает, что сохраняет полный механизм внимания на уровне миллиона токенов.

Значение для производственного развёртывания: DeepSeek-V4 можно запустить на одном сервере с 8×H100, в то время как закрытые аналоги требуют вызовов удалённого API.

Отзывы ранних пользователей

После запуска в конце апреля ранние пользователи сообщают:

  • Скорость отклика: DeepSeek-V4 Pro выдает результаты за ~10 секунд для сопоставимых задач, GPT-5.5 — за ~20 секунд
  • Поиск + рассуждение: Для запросов, требующих мощного поиска и самопроверки, качество ответов сопоставимо
  • Интеграция API: Поддерживается интеграция с настольной версией Claude Code

Оценка ландшафта

Выпуск DeepSeek-V4 знаменует слияние трёх трендов:

  1. Модели с открытым кодом перешли порог «достаточно хороших»: 90% мощности + 1/7 цены = оптимальное решение для большинства корпоративных сценариев
  2. Зрелость архитектуры MoE: Редкая активация позволяет разворачивать триллионные модели при разумных затратах
  3. Ценовая война API необратима: Закрытые поставщики должны ответить, иначе потеряют средний сегмент рынка

Рекомендации к действию

Ваш сценарийРекомендация
Большое использование закрытых API, высокие затратыСначала замените вызовы некритичных путей на DeepSeek-V4 Pro — ожидается экономия 60-80% на API
Нужно локальное развёртывание, данные не покидают предприятиеОткрытые веса DeepSeek-V4 (Apache 2.0) можно загрузить и развернуть напрямую
Нужна максимальная способность к кодированию (разница 0.2 балла важна)Сохраните Opus 4.7 / GPT-5.5 для ключевых задач кодирования
Ограниченный бюджет, массовые вызовыСкидка DeepSeek-V4 Pro продлена до 31 мая — оптимальное окно для тестирования

Скидка DeepSeek действительна до 31 мая 2026 года.