Ant Ring-2.6-1T、思考の強度を動的に調整できる兆パラメータ推論モデルが登場

アントグループの動きは想像より速い。

前世代Ring-1Tのリリースから1ヶ月も経たず、百霊チームは直接Ring-2.6-1Tに跳躍した。兆パラメータ、630億アクティブパラメータ、しかも面白いメカニズムを追加した——動的思考強度。

動的思考強度とは

簡単に言うと、モデルが認知の深さ、トークンコスト、実行速度の間で柔軟にバランスを取れるということだ。

Ring-2.6-1Tはhighとxhighの2つのモードを提供する。highモードは推論速度が速く、トークン消費が少なく、日常のQ&Aや一般的なタスクに適している。xhighモードは認知の深さを最大化し、複雑な推論、コード生成、深い分析が必要なシナリオに適している。

この設計は実に現実的だ。すべてのタスクがモデルに「深く考えさせる」必要はない——単純な事実照会にxhighモードを使うのは純粋なトークンの無駄だ。しかし金融リスク分析をしているなら、xhighは必須だ。

1T総パラメータ、63Bアクティブ。これは典型的なMoE（混合エキスパート）アーキテクチャだ——総参数量は巨大だが、推論ごとに一部のみがアクティブになる。

63Bのアクティブパラメータ量は、ハードウェアの要求が比較的抑えられることを意味する。GPT-4レベルの千億級密モデルと比較して、Ring-2.6-1Tは同等の推論コストでより多くのノードに配備できる。

主要ソース：