DeepSeek V4 全面适配华为昇腾:国产大模型首次在国产芯片上训练和部署

DeepSeek V4 全面适配华为昇腾:国产大模型首次在国产芯片上训练和部署

4 月 24 日,DeepSeek 发布 V4 系列模型——1.6 万亿参数的旗舰版 V4-Pro 和 2840 亿参数的高效版 V4-Flash。但比模型本身更重要的是:这是第一款从训练阶段就基于华为昇腾芯片的国产大模型。

关键数据

指标数值
V4-Pro 总参数1.6 万亿,激活 49B
首 token 延迟20ms
推理算力消耗仅为前代 V3.2 的 27%
昇腾 950 单卡吞吐4700 TPS(8k 输入)
FP4 算力昇腾 950PR 达 1.56P,是 H20 的 2.87 倍
采购成本仅为 H200 的 1/3 到 1/4

从”事后适配”到”原生首发”

此前的国产模型都是先在英伟达 CUDA 生态训练,再花几个月迁移到昇腾 CANN 框架。这次 DeepSeek V4 直接在昇腾 950 上训练,华为数小时内宣布昇腾超节点全系列完整适配。

这意味着国产算力从”备胎”变成了”主力选项”。

Agent 能力跨越式突破

V4-Pro 在 Agent 能力上实现跨越式提升,编码体验超越 Sonnet 4.5,交付质量直追 Opus 4.6。同时推出”快速模式”和”专家模式”,并启动了识图模式灰度测试。

对行业的信号

当最大的开源模型厂商和最大的国产芯片厂商深度绑定,整个生态的飞轮就转起来了。消息发布后,国产 AI 芯片概念股当日暴涨逾 10%。


主要来源:今日头条、chinaz、B站昇腾直播