蚂蚁集团的动作比想象中快。
距离上一代 Ring-1T 发布不到一个月,百灵团队直接跳到了 Ring-2.6-1T。万亿参数,630 亿激活参数,而且加了一个挺有意思的机制——动态思考强度。
动态思考强度是什么
简单说,就是模型可以在认知深度、Token 成本和执行速度之间灵活平衡。
Ring-2.6-1T 提供 high 和 xhigh 两种模式。high 模式下推理速度快一些,Token 消耗低一些,适合日常问答和一般任务。xhigh 模式则拉满认知深度,适合复杂推理、代码生成和需要深度分析的场景。
这种设计其实挺务实的。不是所有任务都需要模型"想得很深"——一个简单的事实查询用 xhigh 模式纯属浪费 Token。但如果你在做金融风控分析,那 xhigh 就是必须的。
参数规模
1T 总参数,63B 激活。这是一个典型的 MoE(混合专家)架构——总参数量巨大,但每次推理只激活一小部分。
63B 的激活参数量意味着它对硬件的要求相对可控。对比 GPT-4 级别的千亿级稠密模型,Ring-2.6-1T 在同等推理成本下可以部署到更多节点上。
为什么蚂蚁要做推理模型
蚂蚁的场景和一般的互联网公司不太一样。金融风控、反欺诈、信贷审批、合规审查——这些场景对模型的精确度和可解释性要求极高。
通用模型在这些场景上往往不够用。你需要一个能在复杂逻辑推理上拉满的模型,同时又不能把 Token 成本拉到不可接受的程度。Ring-2.6-1T 的动态思考强度机制本质上就是为这种场景设计的。
OpenRouter 免费一周
Ring-2.6-1T 已经在 OpenRouter 上线,并且免费一周。这是蚂蚁一贯的策略——先在第三方平台打一波曝光,积累用户反馈,然后再推自己的 API 服务。
免费窗口期是个试用窗口。如果你的业务场景恰好需要高深度推理,这周可以把 Ring-2.6-1T 拉出来跑几个测试用例。
一个观察点
Ring-1T 上次发布时,有观点认为蚂蚁是在"追参数规模"——1T 这个数字本身没有太大意义,关键看实际表现。这次 Ring-2.6-1T 加上了动态思考强度机制,说明蚂蚁的关注点已经从"参数有多大"转向了"怎么让用户用得舒服"。
这是一个正向的变化。但真正的评价标准只有一个:实际场景中的表现能不能打过 Kimi K2.6 和 GLM-5。
下周 OpenRouter 上的用户反馈会给出答案。
→ 延伸阅读:GLM-5 定价调整 | Kimi K2.6 免费 API
主要来源: