アントグループの動きは想像より速い。
前世代Ring-1Tのリリースから1ヶ月も経たず、百霊チームは直接Ring-2.6-1Tに跳躍した。兆パラメータ、630億アクティブパラメータ、しかも面白いメカニズムを追加した——動的思考強度。
動的思考強度とは
簡単に言うと、モデルが認知の深さ、トークンコスト、実行速度の間で柔軟にバランスを取れるということだ。
Ring-2.6-1Tはhighとxhighの2つのモードを提供する。highモードは推論速度が速く、トークン消費が少なく、日常のQ&Aや一般的なタスクに適している。xhighモードは認知の深さを最大化し、複雑な推論、コード生成、深い分析が必要なシナリオに適している。
この設計は実に現実的だ。すべてのタスクがモデルに「深く考えさせる」必要はない——単純な事実照会にxhighモードを使うのは純粋なトークンの無駄だ。しかし金融リスク分析をしているなら、xhighは必須だ。
パラメータ規模
1T総パラメータ、63Bアクティブ。これは典型的なMoE(混合エキスパート)アーキテクチャだ——総参数量は巨大だが、推論ごとに一部のみがアクティブになる。
63Bのアクティブパラメータ量は、ハードウェアの要求が比較的抑えられることを意味する。GPT-4レベルの千億級密モデルと比較して、Ring-2.6-1Tは同等の推論コストでより多くのノードに配備できる。
→ 関連記事:GLM-5価格調整 | Kimi K2.6無料API
主要ソース: