Цены на кэширование ввода DeepSeek API снижены до 1/10: ценовая война выходит на новый этап

Цены на кэширование ввода DeepSeek API снижены до 1/10: ценовая война выходит на новый этап

Ценовая война API искусственного интеллекта перешла во вторую фазу — от конкуренции по базовой цене инференса к конкуренции по реальному ежемесячному счёту разработчика.

26 апреля DeepSeek объявил о значительном снижении цен на кэширование ввода API — до 1/10 от исходной цены по всей линейке продуктов. Изменение вступает в силу немедленно. Одновременно скидка 75% на DeepSeek-V4-Pro остаётся активной до 5 мая.

Смысл прост: если ваше приложение использует повторяющиеся системные промпты или фиксированные шаблоны инструкций, стоимость вызова с кэшированием теперь практически ничтожна.

Как кэширование экономит деньги

Механизм кэширования ввода DeepSeek позволяет переиспользовать промежуточные результаты вычислений (KV-кэш) при отправке идентичных входных префиксов в последующих вызовах, пропуская избыточные прямые проходы. Ранее кэширование было дешевле полного инференса, но всё ещё представляло ощутимую стоимость. При цене 1/10 стоимость кэшированных вызовов приближается к бесплатному уровню.

  • Цена кэширования: 1/10 от исходной, покрывает всю серию
  • Скидка V4-Pro: 75% OFF, действует до 5 мая
  • Миграция не требуется: существующие вызовы автоматически получают новую цену

Вторая фаза ценовой войны

Ценообразование API прошло две волны.

Первая — быстрое падение базовых цен на инференс: от уровня GPT-4 в $30/MTok до $1-3/MTok. Вторая волна нацелена на «фактические расходы» — кэширование, пакетная обработка, переиспользование контекста для снижения реального счёта разработчика. Ценовая стратегия DeepSeek с кэшированием 1/10 — знаковый момент этой второй фазы.

Что это значит для вашего приложения

Если ваше приложение имеет следующие паттерны, снижение цен будет заметно:

  • RAG-системы: сегменты базы знаний как фиксированные префиксы в каждом запросе
  • Многоходовые диалоги Agent: системный промпт отправляется каждый раз
  • Пакетная обработка: большие объёмы схожих по структуре входных данных

Проверьте процент попаданий кэша в панели DeepSeek. Чем выше процент, тем больше экономия. Окно скидки 75% на V4-Pro ещё открыто (до 5 мая).

Основные источники