七家非 AI 公司一周内密集发模型：中国大模型进入"全民造轮子"阶段

一周之内，七家公司的模型发布通知像约好了一样同时弹出来。

小米 Mimo-V2.5、蚂蚁 Ring-1T（1 万亿参数）、阶跃星辰 Step-3.5-Flash、京东 JoyAI-LLM-Flash、百度 ERNIE-5.1、小红书 dots.LLM、美团 LongCat。这份名单读起来不像是 AI 行业发布会，更像是中国互联网巨头的全家福——电商、社交、搜索、本地生活，一个没少。

名单背后的逻辑

这些公司有一个共同点：它们都不是传统意义上的 AI 公司。

小米的核心业务是手机和 IoT，蚂蚁是金融科技，京东是电商，小红书是社区，美团是本地生活。百度稍微例外——文心一言已经迭代了好几轮，但百度本质上还是搜索公司。

它们为什么突然集体造模型？答案其实不复杂。

第一，模型成本已经降到了"每个大厂都养得起"的水平。2024 年训练一个可用模型要烧几亿美元，现在开源权重 + 自研微调的路径把门槛压到了几千万级别。

第二，不用别人的模型，就不受制于人。 调用 API 意味着你的产品体验绑在别人的排期和定价上。对于日活上亿的产品，这种风险 unacceptable。

第三，监管预期在收紧。中国发布的 AI Agent 实施指南明确要求关键场景的模型需要可追溯、可审计。用外部 API，审计链条不好交代。

各家的算盘

蚂蚁 Ring-1T 是这份名单里最扎眼的——1 万亿参数。这个规模已经超过了很多第一梯队模型的参数量级。蚂蚁的动机很直白：金融场景对模型精度和合规的要求极高，通用模型不太够。Ring-1T 大概率是为金融风控、智能客服、反欺诈这些场景量身定制的。

京东 JoyAI-LLM-Flash 名字里带了"Flash"，说明走的是速度和成本路线。京东的核心需求是商品描述生成、客服对话、供应链优化——这些都是高吞吐、低延迟场景，不需要最强的推理能力，但需要稳定且便宜。

小红书 dots.LLM 有点意思。小红书的内容生态高度依赖推荐算法和图文理解，自己的模型可以更好地理解社区语境、审核 UGC 内容、辅助创作者。社区公司做模型，数据飞轮是天然优势——每天产生的图文笔记就是训练数据。

美团 LongCat（长猫？），名字起得随意，但本地生活场景对模型的需求其实很具体：商户推荐、路线规划、即时配送优化、商户内容生成。这些都是"脏活累活"，通用模型做不好。

百度 ERNIE-5.1 是老将了。百度在这个赛道起步最早，但面临的竞争也最激烈。这次更新大概率是对标 Qwen 和 Kimi 的最新版本。

阶跃星辰 Step-3.5-Flash 是这份名单里唯一的"纯 AI 公司"，但它走的是 Flash 路线——快速、低成本、高吞吐。和京东的需求画像重合度很高，说明"快模型"这个细分市场正在成型。

小米 Mimo-V2.5 是小米 AI 战略的延续。手机端侧模型 + 云端协同，这是小米相对于纯软件公司的差异化优势。

信号

这个趋势如果翻译成一句话：中国大模型正在从"少数玩家的游戏"变成"大厂基础设施"。

这和美国的情况不太一样。美国大厂也在做自己的模型（Google Gemini、Meta Llama、Amazon Nova），但数量没这么密集。中国的互联网巨头有一个特点——业务边界模糊，互相渗透。电商做社交，社交做电商，搜索做本地生活。每个公司都需要模型来支撑自己的差异化场景，于是都做了。

短期看，这是好消息——模型选择变多了，竞争加剧会推动价格下降。

长期看，有一个隐患值得观察：这七家公司的模型，有多少是真正自研的，有多少是基于开源权重微调的？如果只是换壳开源模型再包装成"自研"，那这个繁荣就是泡沫。从目前公开的信息来看，蚂蚁 Ring-1T 的 1T 参数规模和百度 ERNIE-5.1 的持续迭代看起来是真正在投入研发，其他几家的技术深度还有待验证。

不过话说回来，换壳也不是坏事。如果开源模型真的能支撑这些大厂的线上业务，那恰恰说明开源生态在走向成熟。

下一次模型版本更新预计在 6-7 月，如果小米和蚂蚁能给出实测数据，这个赛道的格局会更清晰。

主要来源：

X/Twitter 行业账号汇总 (@AI 行业观察)
各公司官方技术博客和 GitHub 仓库
IQS 搜索交叉验证

名单背后的逻辑

各家的算盘

信号

Related

Claude Code 支持 Artifacts：代码代理终于开始交付“能看的现场”

Claude 给 MCP 连接器加企业托管授权：Agent 要进公司，先过身份这一关

Claude Platform 支持 Workload Identity Federation：API Key 时代又被往后推了一步