百川智能掉队了吗？Baichuan 4 发布半年后的冷思考

结论先行

百川智能（Baichuan AI）在 2025 年底发布 Baichuan 4 后，进入了相对沉寂期。与同期的 Qwen 3.6、DeepSeek V4、Kimi K2.6 相比，百川在基准榜单上的存在感显著下降。但这并不意味着百川”掉队”——它正在走一条差异化的垂直行业路线，只是声量策略从”拼榜”转向了”深耕”。

技术路线：Baichuan 4 的真实水平

维度	Baichuan 4	Qwen 3.6 35B	DeepSeek V4	Kimi K2.6
参数规模	~13B (MoE)	35B A3B MoE	236B/27B MoE	未公开
中文推理	第一梯队	第一梯队	第一梯队	第一梯队
代码能力	中上游	顶尖	顶尖	中上游
开源程度	部分开源	全面开源	全面开源	未开源
定价策略	低价	极低/免费	极低	中等

Baichuan 4 采用的是 MoE（混合专家）架构，在 13B 参数规模下实现了接近 70B 稠密模型的性能。这个技术选择有其合理性——在算力受限的前提下追求性价比。

但问题也很明显：当竞争对手把参数规模推到 35B 甚至 236B 时，13B MoE 的上限已经不够看了。

开源策略：从”全面开源”到”有所保留”

百川是最早走开源路线的国产模型厂商之一。早期的 Baichuan-7B、Baichuan-13B 在 Hugging Face 上获得了大量关注。但从 Baichuan 4 开始，开源策略明显收缩：

Baichuan 4 仅开放了推理 API，未释放权重
社区无法自行微调或部署
失去了 Hugging Face 上的自然流量和二次传播

对比 Qwen 团队几乎每款模型都开源权重、DeepSeek 的开源策略更加激进，百川的选择显得有些保守。这直接导致了社区生态的断层——开发者不再以百川模型为基础构建应用。

垂直行业：百川的”暗线”

百川真正的发力点可能不在通用榜单，而在垂直行业。据多方信息交叉验证：

医疗领域：百川与多家三甲医院合作，开发了医疗问答和辅助诊断系统
教育领域：Baichuan 4 在教育场景的微调版本已进入多所重点学校试点
金融领域：与券商合作的知识问答系统已部署

这条路线的优势是利润空间大、客户粘性强；劣势是缺乏公众可见度，难以形成品牌飞轮。

格局判断

厂商	当前策略	风险	机会
Qwen	全面开源+生态绑定	开源合规成本上升	成为全球中文基座模型
DeepSeek	极致性价比+Agent 集成	商业模式可持续性	成为 AI 基础设施层玩家
Kimi	闭源+长文本差异化	技术路线单一依赖	办公场景切入
百川	垂直行业深耕	通用能力被甩开	行业 Know-how 壁垒

百川不是”掉队”，而是主动选择了一条不同的路。但这条路有一个前提：垂直行业的收入能否支撑持续的模型研发投入。如果 Qwen 等厂商也开始做行业定制化，百川的差异化优势将被快速稀释。

行动建议

如果你在选型通用基座模型：当前阶段优先看 Qwen 3.6 和 DeepSeek V4，开源生态和性价比都更成熟
如果你在做行业落地：可以主动联系百川了解行业解决方案，他们在医疗、教育领域的经验值得参考
如果你在投资判断：关注百川下一轮融资和行业客户续约率，这是验证其战略是否跑通的关键指标

百川的故事还没有结束。在 AI 模型从”拼参数”走向”拼场景”的下半场，垂直路线能否跑通，百川将是最值得观察的案例之一。

结论先行

技术路线：Baichuan 4 的真实水平

开源策略：从”全面开源”到”有所保留”

垂直行业：百川的”暗线”

格局判断

行动建议

相关内容

GPT-6进入安全对齐阶段：5-6万亿参数，数学推理92.5%，代码通过率96.8%

MiniMax M3本月即将发布：剑指办公场景，agentic能力大幅升级

GLM-5.1 登陆 0G Private Computer：754B MoE 模型跑进 TEE 意味着什么