一周之内,七家公司的模型发布通知像约好了一样同时弹出来。
小米 Mimo-V2.5、蚂蚁 Ring-1T(1 万亿参数)、阶跃星辰 Step-3.5-Flash、京东 JoyAI-LLM-Flash、百度 ERNIE-5.1、小红书 dots.LLM、美团 LongCat。这份名单读起来不像是 AI 行业发布会,更像是中国互联网巨头的全家福——电商、社交、搜索、本地生活,一个没少。
名单背后的逻辑
这些公司有一个共同点:它们都不是传统意义上的 AI 公司。
小米的核心业务是手机和 IoT,蚂蚁是金融科技,京东是电商,小红书是社区,美团是本地生活。百度稍微例外——文心一言已经迭代了好几轮,但百度本质上还是搜索公司。
它们为什么突然集体造模型?答案其实不复杂。
第一,模型成本已经降到了"每个大厂都养得起"的水平。2024 年训练一个可用模型要烧几亿美元,现在开源权重 + 自研微调的路径把门槛压到了几千万级别。
第二,不用别人的模型,就不受制于人。 调用 API 意味着你的产品体验绑在别人的排期和定价上。对于日活上亿的产品,这种风险 unacceptable。
第三,监管预期在收紧。中国发布的 AI Agent 实施指南 明确要求关键场景的模型需要可追溯、可审计。用外部 API,审计链条不好交代。
各家的算盘
蚂蚁 Ring-1T 是这份名单里最扎眼的——1 万亿参数。这个规模已经超过了很多第一梯队模型的参数量级。蚂蚁的动机很直白:金融场景对模型精度和合规的要求极高,通用模型不太够。Ring-1T 大概率是为金融风控、智能客服、反欺诈这些场景量身定制的。
京东 JoyAI-LLM-Flash 名字里带了"Flash",说明走的是速度和成本路线。京东的核心需求是商品描述生成、客服对话、供应链优化——这些都是高吞吐、低延迟场景,不需要最强的推理能力,但需要稳定且便宜。
小红书 dots.LLM 有点意思。小红书的内容生态高度依赖推荐算法和图文理解,自己的模型可以更好地理解社区语境、审核 UGC 内容、辅助创作者。社区公司做模型,数据飞轮是天然优势——每天产生的图文笔记就是训练数据。
美团 LongCat(长猫?),名字起得随意,但本地生活场景对模型的需求其实很具体:商户推荐、路线规划、即时配送优化、商户内容生成。这些都是"脏活累活",通用模型做不好。
百度 ERNIE-5.1 是老将了。百度在这个赛道起步最早,但面临的竞争也最激烈。这次更新大概率是对标 Qwen 和 Kimi 的最新版本。
阶跃星辰 Step-3.5-Flash 是这份名单里唯一的"纯 AI 公司",但它走的是 Flash 路线——快速、低成本、高吞吐。和京东的需求画像重合度很高,说明"快模型"这个细分市场正在成型。
小米 Mimo-V2.5 是小米 AI 战略的延续。手机端侧模型 + 云端协同,这是小米相对于纯软件公司的差异化优势。
信号
这个趋势如果翻译成一句话:中国大模型正在从"少数玩家的游戏"变成"大厂基础设施"。
这和美国的情况不太一样。美国大厂也在做自己的模型(Google Gemini、Meta Llama、Amazon Nova),但数量没这么密集。中国的互联网巨头有一个特点——业务边界模糊,互相渗透。电商做社交,社交做电商,搜索做本地生活。每个公司都需要模型来支撑自己的差异化场景,于是都做了。
短期看,这是好消息——模型选择变多了,竞争加剧会推动价格下降。
长期看,有一个隐患值得观察:这七家公司的模型,有多少是真正自研的,有多少是基于开源权重微调的?如果只是换壳开源模型再包装成"自研",那这个繁荣就是泡沫。从目前公开的信息来看,蚂蚁 Ring-1T 的 1T 参数规模和百度 ERNIE-5.1 的持续迭代看起来是真正在投入研发,其他几家的技术深度还有待验证。
不过话说回来,换壳也不是坏事。如果开源模型真的能支撑这些大厂的线上业务,那恰恰说明开源生态在走向成熟。
下一次模型版本更新预计在 6-7 月,如果小米和蚂蚁能给出实测数据,这个赛道的格局会更清晰。
主要来源:
- X/Twitter 行业账号汇总 (@AI 行业观察)
- 各公司官方技术博客和 GitHub 仓库
- IQS 搜索交叉验证