海外推論プラットフォームにおける中国産大規模モデルの配置が加速し続けています。2026年4月下旬、Qwen3.6-Plus が Together AI プラットフォームで正式にリリースされ、開発者は標準的な OpenAI 互換 API を介してモデルを直接呼び出せるようになり、自己配備の必要がなくなりました。
何があったか
Together AI は現在、複数のベンダーのモデルにアクセスするための統一された API インターフェースを開発者に提供する、最大のサードパーティモデル推論集約プラットフォームの一つです。Qwen3.6-Plus のプラットフォームでの提供は以下を意味します:
- すぐに使える:GPU や重みファイルの設定は不要。標準 API から直接呼び出し可能
- 自動スケーリング:Together AI の推論インフラが同時実行とロードバランシングを自動的に処理
- OpenAI 互換インターフェース:既存のコードは変更不要。
base_urlとモデル名を切り替えるだけで統合可能
Qwen3.6 シリーズの現在のエコシステムポジショニング
Qwen3.6 シリーズは、アリババの通義千問チームが 2026 年 4 月にリリースしたフラッグシップモデルファミリーで、複数の仕様を含みます:
| モデルバージョン | パラメータ数 | ポジショニング | 主な特徴 |
|---|---|---|---|
| Qwen3.6-35B-A3B | 35B 総パラメータ / 3B アクティブ | 効率的推論 | MoE アーキテクチャ、極めて低い推論コスト |
| Qwen3.6-27B | 27B | ミッドレンジ万能 | 最適なコストパフォーマンス |
| Qwen3.6-Plus | 非公開 | フラッグシップ | トップクラスのフラッグシップに匹敵する総合能力 |
シリーズのフラッグシップモデルとして、Qwen3.6-Plus は LMSys Chatbot Arena などの公開評価で世界トップ10にランクインしており、中国語理解、コード生成、数学的推論において特に優れたパフォーマンスを示しています。
Together AI 配備が重要な理由
これまでの Qwen3.6 シリーズが主にアリババクラウド百錬プラットフォームと Hugging Face 経由で配布されていたのと比較し、今回の Together AI でのリリースには以下の重要な意味があります:
- 海外ユーザーのアクセス障壁の低下:Together AI の主要ユーザー層は北米と欧州に集中しており、Qwen3.6-Plus のリリースにより、これらの開発者がゼロハードルで中国産モデルを体験できる
- API エコシステムの統合:Together AI は Qwen3.6-Plus を Claude や GPT などの他のモデルとハイブリッドにオーケストレーションすることをサポートし、開発者がマルチモデルワークフローを構築しやすくする
- ビジネスシグナル:サードパーティの推論プラットフォームが Qwen モデルの統合とプロモーションに意欲的であることは、そのパフォーマンスとコストが市場で競争力を持っていることを示している
競争格局の判断
主流推論プラットフォームにおける中国産モデルの配置状況:
| プラットフォーム | 統合済み中国産モデル |
|---|---|
| Together AI | Qwen3.6-Plus、Qwen3.6-27B、DeepSeek V4 |
| OpenRouter | Qwen3.6 シリーズ全体、DeepSeek V4、MiniMax |
| Groq | Qwen3.6-27B(超高速推論) |
| アリババクラウド百錬 | Qwen シリーズ全体(最新モデルの独占アクセス) |
Qwen シリーズはサードパーティプラットフォームですでに広範なカバレッジを持っていますが、Together AI での提供は依然として画期的な出来事です—これは世界有数の推論集約プラットフォームが中国産モデルの能力を認めたことを意味します。
アクション推奨事項
- 既存の Together AI ユーザー:
Qwen/Qwen3.6-Plusモデルを直接呼び出せばよい。ストリーミング出力とツール呼び出しをサポート - モデル選定を評価中:特に中国語シナリオや多言語タスクの場合、Qwen3.6-Plus を A/B テスト候補プールに追加することを検討
- コスト重視シナリオ:Qwen3.6-27B と Qwen3.6-35B-A3B の両方を同時にテストすることを推奨。後者は MoE アーキテクチャにより推論コストが更低くなる可能性がある