结论先行
百川智能(Baichuan AI)在 2025 年底发布 Baichuan 4 后,进入了相对沉寂期。与同期的 Qwen 3.6、DeepSeek V4、Kimi K2.6 相比,百川在基准榜单上的存在感显著下降。但这并不意味着百川”掉队”——它正在走一条差异化的垂直行业路线,只是声量策略从”拼榜”转向了”深耕”。
技术路线:Baichuan 4 的真实水平
| 维度 | Baichuan 4 | Qwen 3.6 35B | DeepSeek V4 | Kimi K2.6 |
|---|---|---|---|---|
| 参数规模 | ~13B (MoE) | 35B A3B MoE | 236B/27B MoE | 未公开 |
| 中文推理 | 第一梯队 | 第一梯队 | 第一梯队 | 第一梯队 |
| 代码能力 | 中上游 | 顶尖 | 顶尖 | 中上游 |
| 开源程度 | 部分开源 | 全面开源 | 全面开源 | 未开源 |
| 定价策略 | 低价 | 极低/免费 | 极低 | 中等 |
Baichuan 4 采用的是 MoE(混合专家)架构,在 13B 参数规模下实现了接近 70B 稠密模型的性能。这个技术选择有其合理性——在算力受限的前提下追求性价比。
但问题也很明显:当竞争对手把参数规模推到 35B 甚至 236B 时,13B MoE 的上限已经不够看了。
开源策略:从”全面开源”到”有所保留”
百川是最早走开源路线的国产模型厂商之一。早期的 Baichuan-7B、Baichuan-13B 在 Hugging Face 上获得了大量关注。但从 Baichuan 4 开始,开源策略明显收缩:
- Baichuan 4 仅开放了推理 API,未释放权重
- 社区无法自行微调或部署
- 失去了 Hugging Face 上的自然流量和二次传播
对比 Qwen 团队几乎每款模型都开源权重、DeepSeek 的开源策略更加激进,百川的选择显得有些保守。这直接导致了社区生态的断层——开发者不再以百川模型为基础构建应用。
垂直行业:百川的”暗线”
百川真正的发力点可能不在通用榜单,而在垂直行业。据多方信息交叉验证:
- 医疗领域:百川与多家三甲医院合作,开发了医疗问答和辅助诊断系统
- 教育领域:Baichuan 4 在教育场景的微调版本已进入多所重点学校试点
- 金融领域:与券商合作的知识问答系统已部署
这条路线的优势是利润空间大、客户粘性强;劣势是缺乏公众可见度,难以形成品牌飞轮。
格局判断
| 厂商 | 当前策略 | 风险 | 机会 |
|---|---|---|---|
| Qwen | 全面开源+生态绑定 | 开源合规成本上升 | 成为全球中文基座模型 |
| DeepSeek | 极致性价比+Agent 集成 | 商业模式可持续性 | 成为 AI 基础设施层玩家 |
| Kimi | 闭源+长文本差异化 | 技术路线单一依赖 | 办公场景切入 |
| 百川 | 垂直行业深耕 | 通用能力被甩开 | 行业 Know-how 壁垒 |
百川不是”掉队”,而是主动选择了一条不同的路。但这条路有一个前提:垂直行业的收入能否支撑持续的模型研发投入。如果 Qwen 等厂商也开始做行业定制化,百川的差异化优势将被快速稀释。
行动建议
- 如果你在选型通用基座模型:当前阶段优先看 Qwen 3.6 和 DeepSeek V4,开源生态和性价比都更成熟
- 如果你在做行业落地:可以主动联系百川了解行业解决方案,他们在医疗、教育领域的经验值得参考
- 如果你在投资判断:关注百川下一轮融资和行业客户续约率,这是验证其战略是否跑通的关键指标
百川的故事还没有结束。在 AI 模型从”拼参数”走向”拼场景”的下半场,垂直路线能否跑通,百川将是最值得观察的案例之一。