C
ChaoBro

Qwen 3.6 Max Preview登場:1兆パラメータMoEアーキテクチャ、100万トークンわずか1.30ドル

Qwen 3.6 Max Preview登場:1兆パラメータMoEアーキテクチャ、100万トークンわずか1.30ドル

重要なシグナル

アリババの通義千問 Qwen 3.6 Max Preview がOpenRouterにひっそりと登場した。これはアリババ史上最大规模的なモデルーー1兆パラメータをスパースMixture-of-Experts(MoE)アーキテクチャで構築しながら、同クラスの競合モデルを大幅に下回る価格設定となっている。

項目Qwen 3.6 Max PreviewClaude Opus 4.6GPT-5.5
パラメータ規模1兆(スパース活性化)非公表非公表
コンテキストウィンドウ262K1M200K
入力価格$1.30/M tokens$15.00/M tokens$10.00/M tokens
出力価格$7.80/M tokens$75.00/M tokens$50.00/M tokens
最適化方向Agentic Coding、ツール使用汎用推論エージェント能力
重み公開なしなしなし

価格差は明白:Qwen 3.6 Max Previewの入力価格はClaude Opus 4.6の11分の1、出力価格は10分の1に過ぎない。

アーキテクチャ分解

Qwen 3.6 Max Previewのコア技術的特徴:

  • 1兆パラメータスパースMoE:総パラメータ数は1兆に達するが、推論時には一部のエキスパートのみが活性化される。同等のハードウェアで、密な1兆パラメータモデルに比べてスループットが大幅に向上する。
  • 262Kコンテキストウィンドウ:Claudeの1MやGeminiの2Mには及ばないものの、ほとんどのコードベースレベルのタスクには十分。
  • Agentic Coding特化:コード生成、マルチステップツール呼び出し、自律的デバッグに特化したファインチューニング。Terminal-BenchやSWE-benchでの性能に注目。

なぜ注目すべきか

  1. コストパフォーマンスで競合を圧勝:大量のトークン消費を必要とするエージェントシナリオ(長文脈のコード解析、多ラウンドのツール呼び出し)において、Qwen 3.6 Max Previewのコスト優位性は顕著。
  2. アリババエコシステム統合:アリババクラウドの百煉プラットフォームや通義霊碼に優先的に導入される見込みで、国内開発者は素早くアクセス可能。
  3. オープンソースの追随:Qwen3.6-27Bは既にオープンソース化され、コミュニティからの評価も良好。Max版はオープンソース化されないものの、アリババの最先端モデルへの継続的な投資を示している。

アクション提言

  • 既存のClaude/GPT契約者:OpenRouter上でQwen 3.6 Max Previewをコスト敏感なタスクの主力モデルとして試し、Opus/GPT-5.5は高難度の推論に使い分ける。
  • 中国の開発者:百煉プラットフォームへの導入に注目。より有利な企業向け価格が予想される。
  • エージェント開発者:262Kコンテキスト+低価格の組み合わせは、長文脈のコードベース解析を必要とする自律コーディングエージェントに最適。

リスク注意事項

  • 現在プレビュー版のため、安定性は未検証
  • 重みは公開されておらず、ローカルデプロイは不可
  • 中国語コンテキストでの実際の性能は、コミュニティのフィードバックを待つ必要がある