国产大模型在海外推理平台的布局持续加速。2026 年 4 月底,Qwen3.6-Plus 正式在 Together AI 平台上线,开发者现在可以通过标准 OpenAI 兼容 API 直接调用该模型,无需自行部署。
发生了什么
Together AI 是目前最大的第三方模型推理聚合平台之一,为开发者提供统一的 API 接口访问多家厂商的模型。Qwen3.6-Plus 的上架意味着:
- 即开即用:无需 GPU、无需配置权重文件,通过标准 API 即可调用
- 自动扩展:Together AI 的推理基础设施自动处理并发和负载均衡
- OpenAI 兼容接口:现有代码无需修改,只需切换 base_url 和 model name 即可接入
Qwen3.6 系列当前生态位
Qwen3.6 系列是阿里巴巴通义千问团队在 2026 年 4 月发布的主力模型家族,包含多个规格:
| 模型版本 | 参数量 | 定位 | 特点 |
|---|---|---|---|
| Qwen3.6-35B-A3B | 35B 总参数 / 3B 激活 | 高效推理 | MoE 架构,推理成本极低 |
| Qwen3.6-27B | 27B | 中端全能 | 性价比最优选择 |
| Qwen3.6-Plus | 未公开 | 旗舰级 | 综合能力对标一线旗舰 |
Qwen3.6-Plus 作为系列中的旗舰型号,其综合能力在 LMSys Chatbot Arena 等公开评测中跻身全球前十,特别是在中文理解、代码生成和数学推理方面表现突出。
为什么 Together AI 部署很重要
对比此前 Qwen3.6 系列主要通过阿里云百炼平台和 Hugging Face 分发,此次上架 Together AI 有几个关键意义:
- 降低海外用户接入门槛:Together AI 的主要用户群体集中在北美和欧洲,Qwen3.6-Plus 的上线让这部分开发者可以零门槛体验国产模型
- API 生态整合:Together AI 支持将 Qwen3.6-Plus 与 Claude、GPT 等其他模型进行混合编排,便于开发者构建多模型工作流
- 商业信号:第三方推理平台愿意接入并推广 Qwen 模型,说明其性能和成本在市场上具有竞争力
竞争格局判断
当前主流推理平台上的国产模型布局情况:
| 平台 | 已接入的国产模型 |
|---|---|
| Together AI | Qwen3.6-Plus、Qwen3.6-27B、DeepSeek V4 |
| OpenRouter | Qwen3.6 全系列、DeepSeek V4、MiniMax |
| Groq | Qwen3.6-27B(极速推理) |
| 阿里云百炼 | Qwen 全系列(独家最新模型) |
Qwen 系列在第三方平台的覆盖面已经相当广泛,但 Together AI 的上架仍然是一个标志性事件——这是全球头部推理聚合平台对国产模型能力的认可。
行动建议
- 已有 Together AI 账户:直接调用
Qwen/Qwen3.6-Plus模型即可,支持流式输出和工具调用 - 正在评估模型选型:可以将 Qwen3.6-Plus 加入 A/B 测试候选池,特别是涉及中文场景或多语言任务
- 成本敏感场景:建议同时测试 Qwen3.6-27B 和 Qwen3.6-35B-A3B,后者在 MoE 架构下推理成本可能更低