蚂蚁 Ring-2.6-1T 上线：万亿参数推理模型，还支持动态思考强度调节

蚂蚁集团的动作比想象中快。

距离上一代 Ring-1T 发布不到一个月，百灵团队直接跳到了 Ring-2.6-1T。万亿参数，630 亿激活参数，而且加了一个挺有意思的机制——动态思考强度。

动态思考强度是什么

简单说，就是模型可以在认知深度、Token 成本和执行速度之间灵活平衡。

Ring-2.6-1T 提供 high 和 xhigh 两种模式。high 模式下推理速度快一些，Token 消耗低一些，适合日常问答和一般任务。xhigh 模式则拉满认知深度，适合复杂推理、代码生成和需要深度分析的场景。

这种设计其实挺务实的。不是所有任务都需要模型"想得很深"——一个简单的事实查询用 xhigh 模式纯属浪费 Token。但如果你在做金融风控分析，那 xhigh 就是必须的。

1T 总参数，63B 激活。这是一个典型的 MoE（混合专家）架构——总参数量巨大，但每次推理只激活一小部分。

63B 的激活参数量意味着它对硬件的要求相对可控。对比 GPT-4 级别的千亿级稠密模型，Ring-2.6-1T 在同等推理成本下可以部署到更多节点上。

蚂蚁的场景和一般的互联网公司不太一样。金融风控、反欺诈、信贷审批、合规审查——这些场景对模型的精确度和可解释性要求极高。

通用模型在这些场景上往往不够用。你需要一个能在复杂逻辑推理上拉满的模型，同时又不能把 Token 成本拉到不可接受的程度。Ring-2.6-1T 的动态思考强度机制本质上就是为这种场景设计的。

Ring-2.6-1T 已经在 OpenRouter 上线，并且免费一周。这是蚂蚁一贯的策略——先在第三方平台打一波曝光，积累用户反馈，然后再推自己的 API 服务。

免费窗口期是个试用窗口。如果你的业务场景恰好需要高深度推理，这周可以把 Ring-2.6-1T 拉出来跑几个测试用例。

Ring-1T 上次发布时，有观点认为蚂蚁是在"追参数规模"——1T 这个数字本身没有太大意义，关键看实际表现。这次 Ring-2.6-1T 加上了动态思考强度机制，说明蚂蚁的关注点已经从"参数有多大"转向了"怎么让用户用得舒服"。

这是一个正向的变化。但真正的评价标准只有一个：实际场景中的表现能不能打过 Kimi K2.6 和 GLM-5。

下周 OpenRouter 上的用户反馈会给出答案。

主要来源：