Выручка Cambricon в Q1 выросла на 150%: экспортный контроль США очищает поле для китайских производителей чипов

Ключевое суждение

Два看似独立ных события рассказывают одну и ту же историю:

DeepSeek V4 выпущена 24 апреля, объявила о полном обучении и развёртывании на чипах Huawei Ascend — не полагаясь ни на один GPU Nvidia
Выручка Cambricon в Q1 выросла более чем на 150% год к году, китайские CSP (облачные провайдеры) перешли из тестовой фазы в полномасштабное развёртывание

Эффект экспортного контроля США даёт обратный результат: вместо того чтобы остановить развитие AI в Китае, он создал защищённый монопольный рынок для китайских производителей чипов.

Что произошло

Событие первое: DeepSeek V4 × Ascend 950

Серия DeepSeek V4 (V4-Pro с 1.6T параметрами и V4-Flash с 284B параметрами) основана на чипах Huawei Ascend 950 с этапа обучения. Это первая фронтальная большая модель, спроектированная с источника для адаптации к отечественным чипам.

Ключевые данные:

Вычисления FP4 Ascend 950 в 2.87 раза превышают Nvidia H20
Задержка первого токена低至 20 мс
Huawei в течение нескольких часов объявила о полной адаптации полной серии суперузлов Ascend

Событие второе: Взрыв производительности Cambricon

Согласно последним финансовым данным, выручка Cambricon в Q1 выросла более чем на 150% год к году. Драйвером роста являются не государственные субсидии, а коммерческие заказы — китайские облачные провайдеры переходят от тестирования к крупномасштабному развёртыванию.

Событие третье: Оптимизация MegaMoE vLLM 0.20.0

29 апреля проект vLLM выпустил версию 0.20.0, внедрив оптимизацию MegaMoE. В сочетании с архитектурой MoE DeepSeek V4 Pro были достигнуты значительные улучшения производительности на GB200. Это означает, что DeepSeek V4 может эффективно работать на обеих платформах — Nvidia и Huawei.

Данные: Конкурентоспособность отечественных чипов количественно оценивается

Чип	Сравнение вычислений FP4	Зрелость экосистемы	Представительные клиенты
Huawei Ascend 950	2.87x H20	Высокая (CANN + MindSpore)	DeepSeek, iFlytek
Cambricon MLU	~1.5x H20	Средняя (Neuware)	Несколько CSP
Nvidia H20 (Китайская спецверсия)	Базовая	Наивысшая (CUDA)	Ограничена
Nvidia H100/B200	Значительно превышает	Наивысшая	Запрещена

Обратите внимание на ключевую деталь: Nvidia H100/B200 запрещены для Китая, H20 — значительно降级ная специальная версия. Это означает, что китайские компании не могут купить лучшие чипы Nvidia, даже если хотят — это не «выбор отечественного», а «вынужденное отечественное».

Почему это поворотный момент

В течение последних двух лет质疑, с которыми сталкивались китайские AI-чипы, было: «usable, но не good». Производительность DeepSeek V4 на Ascend разрушает этот нарратив:

Три标志 перехода от «usable» к «good»:

Нативное обучение: Не сначала обучение, затем миграция, а работа на Ascend с первого дня обучения
Превосходство производительности: Вычисления FP4 превышают Nvidia H20, а H20 сам по себе是降级版 — то есть в рамках доступных чипов отечественные чипы больше не являются «резервными вариантами»
Завершение экосистемы: Быстрая адаптация open-source фреймворков вывода, таких как vLLM и MegaMoE, снижает барьеры развёртывания

«Эффект обратного огня» экспортного контроля США

По сути, это классическая история импортозамещения, но ускоренная в 10 раз:

Обычный путь: Отечественные чипы догоняют → 10-15 лет → постепенное замещение
Текущий путь: Импорт заблокирован → Рынок вынужденно открыт → Отечественные чипы получают реальные отзывы клиентов → 2-3 года быстрой итерации

Рост выручки Cambricon на 150% происходит не от государственных заказов, а от активных закупок коммерческих клиентов. Это означает, что отечественные чипы перешли порог «usable» и вступили в стадию «good и cost-effective».

Влияние на индустрию

Для модельных компаний

Контролируемые затраты на вычисления: Больше не受制于 ценообразования и поставок Nvidia
Технический суверенитет: Инфраструктура обучения больше не зависит от внешних цепочек поставок
Снижение рисков соответствия: Использование отечественных чипов не涉及 вопросы соответствия экспортному контролю США

Для чиповых компаний

Определённый рыночный спрос: Потребность китайских AI-компаний в вычислениях реальна и устойчива
Ускорение цикла обратной связи: Крупномасштабное развёртывание приносит отзывы из реальных сценариев,驱动 итерацию чипов
Повышение уверенности капитала: Производительность Cambricon предоставляет якорь оценки для всего трека

Для глобального ландшафта

Ускорение двойного трека: Глобальная AI-инфраструктура разделяется на два трека: «экосистема Nvidia» и «отечественная экосистема»
Борьба за рынки третьих стран: Юго-Восточная Азия, Ближний Восток, Латинская Америка станут конкурентными полями битвы для двух экосистем

Предупреждения о рисках

Разрыв в производительности сохраняется: Ascend 950 нацелен на降级ную H20, а не на H100/B200. В абсолютных вычислениях всё ещё есть разрыв
Барьеры экосистемы: Глобальная экосистема разработчиков CUDA не может быть воспроизведена в краткосрочной перспективе
Риски цепочки поставок: Производство отечественных чипов само по себе всё ещё зависит от внешнего оборудования (литографические машины и т.д.)