Выручка Cambricon в Q1 выросла на 150%: экспортный контроль США очищает поле для китайских производителей чипов

Выручка Cambricon в Q1 выросла на 150%: экспортный контроль США очищает поле для китайских производителей чипов

Ключевое суждение

Два看似独立ных события рассказывают одну и ту же историю:

  1. DeepSeek V4 выпущена 24 апреля, объявила о полном обучении и развёртывании на чипах Huawei Ascend — не полагаясь ни на один GPU Nvidia
  2. Выручка Cambricon в Q1 выросла более чем на 150% год к году, китайские CSP (облачные провайдеры) перешли из тестовой фазы в полномасштабное развёртывание

Эффект экспортного контроля США даёт обратный результат: вместо того чтобы остановить развитие AI в Китае, он создал защищённый монопольный рынок для китайских производителей чипов.

Что произошло

Событие первое: DeepSeek V4 × Ascend 950

Серия DeepSeek V4 (V4-Pro с 1.6T параметрами и V4-Flash с 284B параметрами) основана на чипах Huawei Ascend 950 с этапа обучения. Это первая фронтальная большая модель, спроектированная с источника для адаптации к отечественным чипам.

Ключевые данные:

  • Вычисления FP4 Ascend 950 в 2.87 раза превышают Nvidia H20
  • Задержка первого токена低至 20 мс
  • Huawei в течение нескольких часов объявила о полной адаптации полной серии суперузлов Ascend

Событие второе: Взрыв производительности Cambricon

Согласно последним финансовым данным, выручка Cambricon в Q1 выросла более чем на 150% год к году. Драйвером роста являются не государственные субсидии, а коммерческие заказы — китайские облачные провайдеры переходят от тестирования к крупномасштабному развёртыванию.

Событие третье: Оптимизация MegaMoE vLLM 0.20.0

29 апреля проект vLLM выпустил версию 0.20.0, внедрив оптимизацию MegaMoE. В сочетании с архитектурой MoE DeepSeek V4 Pro были достигнуты значительные улучшения производительности на GB200. Это означает, что DeepSeek V4 может эффективно работать на обеих платформах — Nvidia и Huawei.

Данные: Конкурентоспособность отечественных чипов количественно оценивается

ЧипСравнение вычислений FP4Зрелость экосистемыПредставительные клиенты
Huawei Ascend 9502.87x H20Высокая (CANN + MindSpore)DeepSeek, iFlytek
Cambricon MLU~1.5x H20Средняя (Neuware)Несколько CSP
Nvidia H20 (Китайская спецверсия)БазоваяНаивысшая (CUDA)Ограничена
Nvidia H100/B200Значительно превышаетНаивысшаяЗапрещена

Обратите внимание на ключевую деталь: Nvidia H100/B200 запрещены для Китая, H20 — значительно降级ная специальная версия. Это означает, что китайские компании не могут купить лучшие чипы Nvidia, даже если хотят — это не «выбор отечественного», а «вынужденное отечественное».

Почему это поворотный момент

В течение последних двух лет质疑, с которыми сталкивались китайские AI-чипы, было: «usable, но не good». Производительность DeepSeek V4 на Ascend разрушает этот нарратив:

Три标志 перехода от «usable» к «good»:

  1. Нативное обучение: Не сначала обучение, затем миграция, а работа на Ascend с первого дня обучения
  2. Превосходство производительности: Вычисления FP4 превышают Nvidia H20, а H20 сам по себе是降级版 — то есть в рамках доступных чипов отечественные чипы больше не являются «резервными вариантами»
  3. Завершение экосистемы: Быстрая адаптация open-source фреймворков вывода, таких как vLLM и MegaMoE, снижает барьеры развёртывания

«Эффект обратного огня» экспортного контроля США

По сути, это классическая история импортозамещения, но ускоренная в 10 раз:

Обычный путь: Отечественные чипы догоняют → 10-15 лет → постепенное замещение
Текущий путь: Импорт заблокирован → Рынок вынужденно открыт → Отечественные чипы получают реальные отзывы клиентов → 2-3 года быстрой итерации

Рост выручки Cambricon на 150% происходит не от государственных заказов, а от активных закупок коммерческих клиентов. Это означает, что отечественные чипы перешли порог «usable» и вступили в стадию «good и cost-effective».

Влияние на индустрию

Для модельных компаний

  • Контролируемые затраты на вычисления: Больше не受制于 ценообразования и поставок Nvidia
  • Технический суверенитет: Инфраструктура обучения больше не зависит от внешних цепочек поставок
  • Снижение рисков соответствия: Использование отечественных чипов не涉及 вопросы соответствия экспортному контролю США

Для чиповых компаний

  • Определённый рыночный спрос: Потребность китайских AI-компаний в вычислениях реальна и устойчива
  • Ускорение цикла обратной связи: Крупномасштабное развёртывание приносит отзывы из реальных сценариев,驱动 итерацию чипов
  • Повышение уверенности капитала: Производительность Cambricon предоставляет якорь оценки для всего трека

Для глобального ландшафта

  • Ускорение двойного трека: Глобальная AI-инфраструктура разделяется на два трека: «экосистема Nvidia» и «отечественная экосистема»
  • Борьба за рынки третьих стран: Юго-Восточная Азия, Ближний Восток, Латинская Америка станут конкурентными полями битвы для двух экосистем

Предупреждения о рисках

  • Разрыв в производительности сохраняется: Ascend 950 нацелен на降级ную H20, а не на H100/B200. В абсолютных вычислениях всё ещё есть разрыв
  • Барьеры экосистемы: Глобальная экосистема разработчиков CUDA не может быть воспроизведена в краткосрочной перспективе
  • Риски цепочки поставок: Производство отечественных чипов само по себе всё ещё зависит от внешнего оборудования (литографические машины и т.д.)

Рекомендации к действию

  • AI-компании, работающие в Китае: Пересмотрите стратегию вычислений, Ascend+Cambricon уже являются надёжной альтернативой
  • Инвесторы в чипы: Рост выручки Cambricon — это отраслевой сигнал — весь трек отечественных AI-чипов ускоряется
  • Зарубежные разработчики: Обратите внимание на оптимизацию вывода vLLM + MegaMoE для моделей MoE, это ключ для кросс-платформенного развёртывания