核心发现
DeepSeek V4 的延迟发布在 4 月下旬引发了广泛猜测。但据央视关联账号披露,这不是研发受阻,而是一个** deliberate(刻意的)战略选择**:
“与其急于发布与西方前沿模型竞争,DeepSeek 选择将 V4 深度适配中国国产芯片生态——特别是华为昇腾 Ascend。”
4 月 24 日,DeepSeek 发布了基于华为 CANN 的高性能推理优化实践报告,全面支持华为昇腾 Supernode。这证实了战略转型的真实性。
为什么这是一个重大信号
背景:中国 AI 芯片的困境
| 维度 | NVIDIA | 华为昇腾 |
|---|---|---|
| 训练生态 | CUDA 生态成熟,全球主流 | CANN 生态建设中 |
| 获取难度 | 受美国出口管制限制 | 国内可获取 |
| 推理性能 | 行业标杆 | 快速追赶 |
| 软件适配 | 几乎所有模型原生支持 | 需要定制适配 |
长期以来,中国 AI 公司的策略是:用 NVIDIA GPU 训练,用国产芯片推理。但 DeepSeek V4 的选择意味着训练端也在向国产芯片转移。
技术含义
DeepSeek V4 是万亿参数级别的 MoE 模型,对训练基础设施的要求极高。如果它能在昇腾上完成训练,意味着:
- 华为昇腾的训练能力被验证:不再是”推理够用,训练不行”
- CUDA 依赖可以被打破:至少对于 MoE 架构,国产芯片有可行路径
- 供应链安全的战略选择:在美国持续收紧出口管制的背景下,这是一个防御性布局
DeepSeek 的昇腾适配进展
根据 4 月 24 日发布的技术报告:
| 阶段 | 时间 | 成果 |
|---|---|---|
| Ascend Day 0 | 2026.04.24 | 基于 CANN 的高性能推理优化 |
| Supernode 支持 | 同步 | 全面支持华为昇腾 Supernode |
| 权重开源 | 预览版已发布 | 开发者可在昇腾上测试推理 |
值得注意的是,DeepSeek 同时开源了模型权重——这不仅是为了技术社区,也是为了让昇腾生态的开发者能够尽早适配。
行业影响
对其他国产模型公司
DeepSeek 的选择可能成为一个示范效应:
- 如果 V4 在昇腾上表现良好:其他公司(Qwen、Kimi、GLM)可能加速国产芯片适配
- 如果表现不达预期:可能强化”NVIDIA 不可替代”的观点
对华为
- 昇腾生态的重大背书:头部 AI 公司主动适配是最好的广告
- CANN 软件栈的实战检验:万亿参数 MoE 模型的训练和推理是极限测试
对 NVIDIA
- 中国市场进一步流失:即使 H20 等特供版芯片也在被替代
- 但短期影响有限:全球 AI 训练仍主要依赖 NVIDIA
格局判断
这不仅仅是一个模型的延迟发布——这是中国 AI 基础设施路线的一个分水岭。
过去几年,中国 AI 公司的默认选择是 NVIDIA GPU + CUDA 生态。DeepSeek V4 的昇腾适配战略意味着:
- 训练端的国产替代从”可能”走向”实践”
- AI 与芯片的协同发展成为中国 AI 的战略核心
- 美国出口管制反而加速了中国自主生态的构建
行动建议
- 企业用户:如果你的业务在中国大陆运行,关注 DeepSeek V4 在昇腾上的实际性能表现,这可能影响你的技术选型
- 开发者:DeepSeek 已开源权重,建议尽早尝试在昇腾环境上部署和测试
- 投资者:华为昇腾生态的投资价值可能被重新评估,关注相关产业链公司