结论:万亿参数模型的定价底线被改写
2026 年 4 月 27 日,阿里通义千问 Qwen 3.6 Max Preview 正式登陆 OpenRouter 平台。
核心数据:
| 指标 | 数值 |
|---|---|
| 参数量 | 1 万亿(稀疏 MoE) |
| 上下文窗口 | 262K tokens |
| 输入价格 | $1.30/百万 token |
| 输出价格 | $7.80/百万 token |
| 权重开放 | ❌ 闭源 |
| 优化方向 | Agentic Coding、工具调用 |
这不是又一个”参数多价格高”的传统定价故事。Qwen 3.6 Max Preview 的输入价格仅为 GPT-5.5 的 35%,输出价格仅为 Claude Opus 4.7 的 31%。
定价对比:谁在真正打价格战
| 模型 | 参数量 | 输入价格 | 输出价格 | 上下文 |
|---|---|---|---|---|
| Qwen 3.6 Max Preview | 1T (MoE) | $1.30 | $7.80 | 262K |
| GPT-5.5 | 未公开 | $3.75 | $25.00 | 2M |
| Claude Opus 4.7 | 未公开 | $5.00 | $25.00 | 200K |
| Gemini 2.5 Pro | 未公开 | $2.50 | $15.00 | 1M |
| DeepSeek V4 Pro | 671B (MoE) | $1.50 | $6.00 | 128K |
Qwen 3.6 Max Preview 的定价策略很清晰:用接近 DeepSeek V4 Pro 的价格,提供万亿参数级别的性能。 考虑到 Max 版本在 SWE-bench 和各类编码评测中的表现,这个定价对开发者来说是一个性价比极高的选择。
OpenRouter 上架的意义
在此之前,Qwen 3.6 Max Preview 只能通过阿里云 DashScope API 调用。上架 OpenRouter 意味着:
- 全球开发者可以直接调用,无需注册阿里云账号或处理国际支付
- 与 Claude、GPT、Gemini 等模型在同一个平台横向对比,性能差异一目了然
- 路由选择灵活化:可以根据任务类型在 Qwen Max、GPT-5.5、Claude Opus 之间自动切换
性能定位:万亿参数的”Preview”意味什么
“Preview”标签说明这还不是最终版本。但从已披露的评测数据来看:
- SWE-bench Verified:与 GPT-5.5 和 Claude Opus 4.7 处于同一梯队
- Agentic Coding:专门针对工具调用和代码 Agent 场景优化
- 稀疏 MoE 架构:1T 总参数,但实际推理激活的参数量远低于密集模型,这解释了为什么能在保持万亿参数性能的同时压低价格
可以怎么用
- 长上下文分析任务:262K 窗口 + 万亿参数,适合处理超长代码库、法律文档、技术手册
- Agentic Coding Pipeline:针对工具调用优化的特性,适合作为 Agent 工作流中的编码节点
- 成本敏感的生产场景:如果你的应用场景不需要 GPT-5.5 的 2M 上下文,Qwen 3.6 Max 提供了同等智力级别但成本降低 60% 的替代方案
格局判断
Qwen 3.6 Max Preview 上架 OpenRouter 是阿里 AI 国际化战略的关键一步。它标志着中国大模型厂商不再满足于国内市场,而是直接在国际 API 定价战场上与美国巨头正面交锋。
对开发者来说,这是一个好消息:万亿参数级别的模型能力正在变成公共服务,价格正在快速趋近于”公共事业”水平。 2024 年调用 GPT-4 的成本,现在可以调用一个万亿参数模型 50 次。