Обзор DeepSeek V4: Может ли модель с 1.6T параметров на равных конкурировать с лидерами?

Вывод

DeepSeek V4 — ближайшая к лидеру open-source модель, приближающаяся к уровню GPT-5.4 / Opus 4.5+ с разницей менее 0.2 балла, при цене API в 1/7–1/9. Позиционирование ясно: доступная передовая возможность, а не погоня за SOTA.

Для бюджетных команд прототипирования и пакетного инференса; не для сценариев, требующих предельной производительности — отставание от GPT-5.5 и Opus 4.7 составляет примерно 4–5 месяцев.

Параметры

Архитектура

MoE-архитектура, 1.6 трлн параметров, контекст 1 млн токенов, 50+ языков. Первая масштабная модель, обученная почти полностью на чипах Huawei Ascend.

Бенчмарки

Бенчмарк	DeepSeek V4	GPT-5.5	Claude Opus 4.7
SWE-bench Pro	~58%	58.6%	64.3%
Terminal-Bench 2.0	~75%	82.7%	~70%
AIME 2025	~90%	~95%	~93%

Стоимость

API: $3.48/MTok выходных токенов. Стоимость AA Index: $1 071 — в пять раз дешевле Opus 4.7.

Обзор DeepSeek V4: Может ли модель с 1.6T параметров на равных конкурировать с лидерами?

Вывод

Параметры

Архитектура

Бенчмарки

Стоимость

Рекомендации

Источники

Вывод

Параметры

Архитектура

Бенчмарки

Стоимость

Рекомендации

Источники

Похожие материалы

Kimi K2.6 возглавляет Design Arena: Moonshot AI превосходит все американские модели в 3D-дизайне

Обзор Qwen 3.6 Max BS Benchmark: способность к антигаллюцинациям превосходит все модели OpenAI

Бенчмарк цепочечного рассуждения Oxford/LLNL: GPT 95,7% по отдельности, коллапс до 9,83% в цепочке