C
ChaoBro

阿里 Qwen3.6-Max-Preview 登顶国产模型榜首,智能体编程能力大幅提升

阿里 Qwen3.6-Max-Preview 登顶国产模型榜首,智能体编程能力大幅提升

4 月 20 日,阿里发布新一代千问旗舰模型的预览版 Qwen3.6-Max-Preview,在 Artificial Analysis 权威评测中超越 GLM-5.1 和 MiniMax-M2.7,登顶最佳国产模型。

关键提升

基准 提升幅度
SkillsBench(智能体编程) +9.9 分
SciCode(科学代码) +10.8 分
NL2Repo +5.0 分
Terminal-Bench 显著提升

闭源预览,暂不开源

此次 Max-Preview 采用闭源形式发布,不开放权重,仅通过阿里云百炼平台和 Qwen Studio 提供 API 服务。千问 3.6 系列已推出 Max-Preview、Plus、Flash 三个版本,并开源了 Qwen3.6-35B-A3B。

性价比定位

在 100-250 元/千次的高端成本区间内,Qwen3.6-Max-Preview 的综合能力超过了同价位的 Claude 和 GPT 竞品。普通用户可在 Qwen Studio 免费体验,企业及开发者可通过百炼获取 API。

千问 3.6 家族

模型 类型 状态
Qwen3.6-Max-Preview 闭源旗舰预览 API 可用
Qwen3.6-Plus 闭源旗舰 4月2日发布
Qwen3.6-Flash 闭源轻量版 已上线
Qwen3.6-35B-A3B 开源 MoE 已开源
Qwen3.6-27B 开源多模态 4月22日发布

4 月 22 日发布的 Qwen3.6-27B 同样值得关注——仅 270 亿参数的稠密多模态模型,在多项编程基准上全面超越了前代总参数量 3970 亿的 Qwen3.5-397B-A17B,上演"以小博大"。


主要来源:中关村在线、上证报、chinaz