Основной вывод
26 апреля DeepSeek одновременно запустил две корректировки цен: цены на кэш-хиты API серии V4 навсегда снижены до 1/10 от исходных и временная скидка 75% на V4-Pro (до 5 мая). В сочетании цена кэш-хита V4-Pro снижается до примерно $0,0036/M token — это в 139 раз дешевле GPT-5.5 и в 83 раза дешевле Claude Sonnet 4.6. Это не просто акция, а системная реструктуризация экономики затрат для сценариев с длинным контекстом.
Сравнение данных
| Модель | Цена кэш-хита | Отн. DeepSeek V4-Pro | Примечание |
|---|---|---|---|
| DeepSeek V4-Pro (со скидкой) | ~$0,0036/M | базовая | Кэш 1/10 + скидка 75% совмещены |
| GPT-5.5 | ~$0,50/M | в 139 раз дороже | Официальная цена OpenAI |
| Claude Sonnet 4.6 | ~$0,30/M | в 83 раза дороже | Официальная цена Anthropic |
| DeepSeek V4-Pro (исходная) | ~$0,014/M | в 3,9 раза | Только кэш 1/10, без скидки |
Ключевой сдвиг: кэш-хиты перешли из «опции экономии» в «абсолютное преимущество по стоимости». Для сценариев, требующих повторных вызовов одного и того же контекста (RAG, многоходовые диалоги агентов, анализ кодовой базы), разница в стоимости перешла от процентного уровня к порядку величины.
Что произошло
Цена кэш-хита снижена до 1/10
DeepSeek официально объявил 26 апреля, что цены на input cache hit для всей серии моделей V4 навсегда снижены до 1/10 от исходных. Это не временное предложение, а永久ное изменение ценообразования.
Скидка 75% на V4-Pro одновременно
Помимо снижения цен на кэш, модели V4-Pro одновременно получают скидку 75% (до 5 мая). В сочетании эффективная стоимость для сценариев с кэш-хитами сжимается до крайне низкого уровня.
Бесплатный доступ через Национальную суперкомпьютерную сеть
Платформа Национальной суперкомпьютерной сети Китая одновременно объявила о временном бесплатном доступе к DeepSeek V4, ещё больше снижая барьер для тестирования разработчиками. Сторонняя агрегирующая платформа ZenMux также последовала с временным бесплатным тестированием.
Почему это важно
Миллион токенов длинного контекста: от «можно» к «практично»
Ранее стоимость миллиона токенов контекста в коммерческих API была настолько высокой, что вызывала колебания. Для 1M токенов:
- GPT-5.5: ~$500
- Claude Sonnet 4.6: ~$300
- DeepSeek V4-Pro (со скидкой кэш-хит): ~$3,60
Разница перешла от «в несколько раз дороже» к «на два порядка дороже». Это означает, что сценарии с длинным текстом, ранее заброшенные из-за стоимости — полный анализ кодовой базы, обработка полных юридических документов, суммаризация сверхдлинных записей совещаний — теперь экономически жизнеспособны.
Каскадный эффект для сценариев агентов
Одна из ключевых проблем Agentic AI — повторное потребление контекста. Рабочий процесс агента может многократно читать одни и те же системные подсказки, определения инструментов и контекстные документы на протяжении нескольких шагов. Снижение цен на кэш-хиты напрямую решает эту проблему:
- Циклы вызова инструментов: Каждый шаг агента требует повторного чтения определений инструментов; кэш-хиты делают эти повторяющиеся токены практически бесплатными
- Мультиагентное сотрудничество: Когда несколько агентов共享 один и тот же контекст базы знаний, выгоды от повторного использования кэша умножаются
- RAG-конвейеры: Извлечённые фрагменты документов многократно появляются в многоходовых диалогах; чем выше частота кэш-хитов, тем ниже стоимость
Ценовая война выходит на глубокие воды
Настройка DeepSeek посылает чёткий сигнал: захват экосистемы разработчиков через предельную экономическую эффективность. Когда цены на кэш-хиты падают до $0,0036/M token, конкуренты должны либо последовать со снижением цен, либо потерять话语权 в нарративе экономической эффективности. Это предвещает расширение конкуренции на рынке AI API 2026 года от «способности моделей» к «стоимости использования».
Оценка ландшафта
| Измерение | DeepSeek | Другие |
|---|---|---|
| Цена кэш-хита | Самая низкая в отрасли | Обычно в 50-140 раз выше |
| Стратегия ценообразования длинного контекста | Агрессивное снижение | Консервативные корректировки |
| Покрытие бесплатного тестирования | Суперкомпьютерная платформа + сторонние агрегаторы | Независимые предложения |
| Влияние на экосистему | Сильный стимул для миграции разработчиков | Рост давления на удержание |
Тренд: DeepSeek использует стратегию «давления стоимостью» чтобы争夺 позицию выбора по умолчанию для средне-длинных сценариев контекста. Если конкуренты не последуют, разработчики в бюджетно-чувствительных сценариях естественно потекут к DeepSeek.
Рекомендации к действию
Что можно сделать сейчас
- Переключите сценарии кэш-хитов на DeepSeek V4-Pro: Если ваше приложение имеет большой повторяющийся контекст (RAG, вызовы инструментов агента), немедленно протестируйте миграцию. Преимущество по стоимости максимально в период скидки
- Оптимизируйте частоту кэш-хитов: Убедитесь, что системные подсказки, определения инструментов и другие фиксированные части остаются стабильными, чтобы максимизировать долю кэш-хитов. Целевая частота хитов >80%
- Используйте бесплатные периоды для стресс-тестирования: Используйте временные бесплатные квоты Национальной суперкомпьютерной сети или ZenMux для проведения масштабного тестирования V4 и оценки, соответствует ли качество модели вашим потребностям
За чем следить
- Продолжение скидки на V4-Pro после 5 мая: Скидка 75% ограничена по времени; после истечения стоимость вернётся примерно в 4 раза (но останется значительно ниже конкурентов)
- Скорость реакции конкурентов: Наблюдайте, ответят ли OpenAI и Anthropic на изменения цен на кэш
- Надёжность механизма кэша: Консистентность кэша DeepSeek и частота хитов нуждаются в проверке в различных сценариях
Примечания о рисках
- Приглушённая реакция фондового рынка США после запуска и рост внутренних пользователей ниже ожиданий предполагают, что снижение цен может быть реакцией на вялый рост пользователей
- Экстремально низкие цены могут сопровождаться компромиссами в качестве обслуживания или доступности; тщательное тестирование необходимо для продакшена
- Кэш-хиты зависят от консистентности запросов; сценарии с динамически изменяющимся контекстом не могут получить полное преимущество по стоимости