Ключевое суждение
Два看似独立ных события рассказывают одну и ту же историю:
- DeepSeek V4 выпущена 24 апреля, объявила о полном обучении и развёртывании на чипах Huawei Ascend — не полагаясь ни на один GPU Nvidia
- Выручка Cambricon в Q1 выросла более чем на 150% год к году, китайские CSP (облачные провайдеры) перешли из тестовой фазы в полномасштабное развёртывание
Эффект экспортного контроля США даёт обратный результат: вместо того чтобы остановить развитие AI в Китае, он создал защищённый монопольный рынок для китайских производителей чипов.
Что произошло
Событие первое: DeepSeek V4 × Ascend 950
Серия DeepSeek V4 (V4-Pro с 1.6T параметрами и V4-Flash с 284B параметрами) основана на чипах Huawei Ascend 950 с этапа обучения. Это первая фронтальная большая модель, спроектированная с источника для адаптации к отечественным чипам.
Ключевые данные:
- Вычисления FP4 Ascend 950 в 2.87 раза превышают Nvidia H20
- Задержка первого токена低至 20 мс
- Huawei в течение нескольких часов объявила о полной адаптации полной серии суперузлов Ascend
Событие второе: Взрыв производительности Cambricon
Согласно последним финансовым данным, выручка Cambricon в Q1 выросла более чем на 150% год к году. Драйвером роста являются не государственные субсидии, а коммерческие заказы — китайские облачные провайдеры переходят от тестирования к крупномасштабному развёртыванию.
Событие третье: Оптимизация MegaMoE vLLM 0.20.0
29 апреля проект vLLM выпустил версию 0.20.0, внедрив оптимизацию MegaMoE. В сочетании с архитектурой MoE DeepSeek V4 Pro были достигнуты значительные улучшения производительности на GB200. Это означает, что DeepSeek V4 может эффективно работать на обеих платформах — Nvidia и Huawei.
Данные: Конкурентоспособность отечественных чипов количественно оценивается
| Чип | Сравнение вычислений FP4 | Зрелость экосистемы | Представительные клиенты |
|---|---|---|---|
| Huawei Ascend 950 | 2.87x H20 | Высокая (CANN + MindSpore) | DeepSeek, iFlytek |
| Cambricon MLU | ~1.5x H20 | Средняя (Neuware) | Несколько CSP |
| Nvidia H20 (Китайская спецверсия) | Базовая | Наивысшая (CUDA) | Ограничена |
| Nvidia H100/B200 | Значительно превышает | Наивысшая | Запрещена |
Обратите внимание на ключевую деталь: Nvidia H100/B200 запрещены для Китая, H20 — значительно降级ная специальная версия. Это означает, что китайские компании не могут купить лучшие чипы Nvidia, даже если хотят — это не «выбор отечественного», а «вынужденное отечественное».
Почему это поворотный момент
В течение последних двух лет质疑, с которыми сталкивались китайские AI-чипы, было: «usable, но не good». Производительность DeepSeek V4 на Ascend разрушает этот нарратив:
Три标志 перехода от «usable» к «good»:
- Нативное обучение: Не сначала обучение, затем миграция, а работа на Ascend с первого дня обучения
- Превосходство производительности: Вычисления FP4 превышают Nvidia H20, а H20 сам по себе是降级版 — то есть в рамках доступных чипов отечественные чипы больше не являются «резервными вариантами»
- Завершение экосистемы: Быстрая адаптация open-source фреймворков вывода, таких как vLLM и MegaMoE, снижает барьеры развёртывания
«Эффект обратного огня» экспортного контроля США
По сути, это классическая история импортозамещения, но ускоренная в 10 раз:
Обычный путь: Отечественные чипы догоняют → 10-15 лет → постепенное замещение
Текущий путь: Импорт заблокирован → Рынок вынужденно открыт → Отечественные чипы получают реальные отзывы клиентов → 2-3 года быстрой итерации
Рост выручки Cambricon на 150% происходит не от государственных заказов, а от активных закупок коммерческих клиентов. Это означает, что отечественные чипы перешли порог «usable» и вступили в стадию «good и cost-effective».
Влияние на индустрию
Для модельных компаний
- Контролируемые затраты на вычисления: Больше не受制于 ценообразования и поставок Nvidia
- Технический суверенитет: Инфраструктура обучения больше не зависит от внешних цепочек поставок
- Снижение рисков соответствия: Использование отечественных чипов не涉及 вопросы соответствия экспортному контролю США
Для чиповых компаний
- Определённый рыночный спрос: Потребность китайских AI-компаний в вычислениях реальна и устойчива
- Ускорение цикла обратной связи: Крупномасштабное развёртывание приносит отзывы из реальных сценариев,驱动 итерацию чипов
- Повышение уверенности капитала: Производительность Cambricon предоставляет якорь оценки для всего трека
Для глобального ландшафта
- Ускорение двойного трека: Глобальная AI-инфраструктура разделяется на два трека: «экосистема Nvidia» и «отечественная экосистема»
- Борьба за рынки третьих стран: Юго-Восточная Азия, Ближний Восток, Латинская Америка станут конкурентными полями битвы для двух экосистем
Предупреждения о рисках
- Разрыв в производительности сохраняется: Ascend 950 нацелен на降级ную H20, а не на H100/B200. В абсолютных вычислениях всё ещё есть разрыв
- Барьеры экосистемы: Глобальная экосистема разработчиков CUDA не может быть воспроизведена в краткосрочной перспективе
- Риски цепочки поставок: Производство отечественных чипов само по себе всё ещё зависит от внешнего оборудования (литографические машины и т.д.)
Рекомендации к действию
- AI-компании, работающие в Китае: Пересмотрите стратегию вычислений, Ascend+Cambricon уже являются надёжной альтернативой
- Инвесторы в чипы: Рост выручки Cambricon — это отраслевой сигнал — весь трек отечественных AI-чипов ускоряется
- Зарубежные разработчики: Обратите внимание на оптимизацию вывода vLLM + MegaMoE для моделей MoE, это ключ для кросс-платформенного развёртывания