Обзор DeepSeek V4: Может ли модель с 1.6T параметров на равных конкурировать с лидерами?

Обзор DeepSeek V4: Может ли модель с 1.6T параметров на равных конкурировать с лидерами?

Вывод

DeepSeek V4 — ближайшая к лидеру open-source модель, приближающаяся к уровню GPT-5.4 / Opus 4.5+ с разницей менее 0.2 балла, при цене API в 1/7–1/9. Позиционирование ясно: доступная передовая возможность, а не погоня за SOTA.

Для бюджетных команд прототипирования и пакетного инференса; не для сценариев, требующих предельной производительности — отставание от GPT-5.5 и Opus 4.7 составляет примерно 4–5 месяцев.

Параметры

Архитектура

MoE-архитектура, 1.6 трлн параметров, контекст 1 млн токенов, 50+ языков. Первая масштабная модель, обученная почти полностью на чипах Huawei Ascend.

Бенчмарки

БенчмаркDeepSeek V4GPT-5.5Claude Opus 4.7
SWE-bench Pro~58%58.6%64.3%
Terminal-Bench 2.0~75%82.7%~70%
AIME 2025~90%~95%~93%

Стоимость

API: $3.48/MTok выходных токенов. Стоимость AA Index: $1 071 — в пять раз дешевле Opus 4.7.

Рекомендации

Команды в Китае: Приоритет. Сильный китайский, гибкое развёртывание, минимальная стоимость.

Пакетные задачи: Оптимальный выбор.

Предельная производительность: Пока не рекомендуется.

Источники