C
ChaoBro

阿里 Qwen3.6-Max-Preview が国産モデル首位に、エージェントプログラミング能力が大幅向上

阿里 Qwen3.6-Max-Preview が国産モデル首位に、エージェントプログラミング能力が大幅向上

4月20日、阿里は次世代千問フラッグシップモデルのプレビュー版 Qwen3.6-Max-Preview をリリースし、権威ある Artificial Analysis の評価において GLM-5.1 と MiniMax-M2.7 を上回り、国産モデルの首位に立った。

主な向上点

ベンチマーク 向上幅
SkillsBench(エージェントプログラミング) +9.9 ポイント
SciCode(科学コード) +10.8 ポイント
NL2Repo +5.0 ポイント
Terminal-Bench 大幅な向上

クローズドソース・プレビュー、当面オープンソース化なし

今回の Max-Preview はクローズドソース形式でリリースされ、ウェイトは公開されていない。API サービスは阿里云百煉プラットフォームと Qwen Studio のみで提供される。千問 3.6 シリーズはすでに Max-Preview、Plus、Flash の3バージョンをリリースしており、Qwen3.6-35B-A3B はオープンソース化されている。

コストパフォーマンスのポジショニング

1,000 リクエストあたり 100〜250 元というハイレベルなコスト帯域において、Qwen3.6-Max-Preview の総合能力は同価格帯の Claude や GPT の競合モデルを上回っている。一般ユーザーは Qwen Studio で無料で体験でき、企業や開発者は百煉を通じて API を利用できる。

千問 3.6 ファミリー

モデル タイプ ステータス
Qwen3.6-Max-Preview クローズドソース・フラッグシッププレビュー API 利用可能
Qwen3.6-Plus クローズドソース・フラッグシップ 4月2日リリース
Qwen3.6-Flash クローズドソース・軽量版 リリース済み
Qwen3.6-35B-A3B オープンソース MoE オープンソース化済み
Qwen3.6-27B オープンソース・マルチモーダル 4月22日リリース

4月22日にリリースされた Qwen3.6-27B も注目に値する。わずか 270 億パラメータの高密度マルチモーダルモデルであり、複数のプログラミングベンチマークにおいて、総パラメータ数 3,970 億の前世代 Qwen3.5-397B-A17B を全面的に上回り、「小が大を凌ぐ」展開を見せた。


主要情報源:中関村在線、上海証券報、chinaz