文心 5.1 Preview 杀入 LMArena 全球前 15：国产模型唯一的突围者

核心结论

LMSYS Chatbot Arena 4 月 30 日最新排名显示，百度文心 5.1 Preview 以 1476 分 登上文本能力榜国内第一、全球前 15 的位置。这是当前全球 Top 15 中 唯一的国产模型，排位超过了 GPT-5.5 和 DeepSeek-V4-Pro。

与此同时，智谱 GLM-5.1 与 Kimi K2.6 在编程 Agent 场景中的实战体感评级已进入”过 entry 梯队”，与文心 5.1 形成国产模型的三足鼎立格局。

文心 5.1 的关键突破在于纯文本对话质量——这在 LMArena 的众包盲评机制下是最难”刷”的指标，因为评价者是真实用户在不知情情况下对两个匿名模型的回答进行投票。

从社区开发者的实际体感来看，当前国产模型已形成清晰的分工格局：

第一梯队（过 entry）：

第二梯队（没过 entry）：

这一分层说明：国产模型不再是”谁更好”的单一问题，而是”什么场景用什么模型”的选择问题——与 2012-2016 年智能手机市场的演化路径高度相似。

LMArena 排名会持续更新，文心 5.1 能否在正式版中保持这一位置，还需要观察。但作为国产模型在全球权威榜单上的首次 Top 15 突破，这一信号已经足够明确。