阿里发布 Qwen3.6-Max-Preview:千问最强旗舰,智能体编程能力显著提升

阿里发布 Qwen3.6-Max-Preview:千问最强旗舰,智能体编程能力显著提升

4 月 20 日,阿里巴巴发布了 Qwen 系列的最新旗舰模型早期预览版:Qwen3.6-Max-Preview。这是千问系列目前性能最强的模型,在多个维度上较此前的 Qwen3.6-Plus 有明显提升。

核心能力

Qwen3.6-Max-Preview 是一个纯文本模型,支持思考和非思考两种模式,但目前不支持图像等多模态输入。在第三方评测平台 Artificial Analysis 的智能指数排名中,该模型得分为 52 分,超过了 GLM-5.1 和 MiniMax-M2.7,成为榜单上得分最高的国产模型。

提升最显著的领域

  • 智能体编程(Agent Coding):这是 Qwen3.6-Max-Preview 的核心升级方向。模型在理解复杂编程任务、多文件协作和代码自检方面有显著提升。有社区实测指出,在前端代码生成任务中,Qwen3.6-Max 的表现已经接近甚至在某些场景超越 Claude Opus。
  • 世界知识:相比 Qwen3.6-Plus,在常识推理和事实性问答方面有明显改进。
  • 长上下文理解:虽然具体的上下文窗口上限尚未完全披露,但从架构设计来看,长文档处理能力是重点优化方向。

架构与开源情况

阿里在同日开源了 Qwen3.6-27B 稠密模型(Apache 2.0 协议),定位为面向本地私有化、Agent 开发和代码工程的旗舰级开源模型。与 MoE 架构不同,27B 稠密模型没有路由开销,部署更简单。

模型架构参数量开源定位
Qwen3.6-Max-Preview闭源(API)未披露旗舰预览,最强性能
Qwen3.6-27B稠密 Dense27BApache 2.0本地部署,Agent 开发
Qwen3.6-Plus未披露未披露上一代主力模型

与竞品的对比

在 Artificial Analysis 榜单上,Qwen3.6-Max-Preview 的 52 分意味着它已经进入了全球第一梯队。但需要注意几个边界:

  • 纯文本限制:不支持多模态输入,在需要图像理解的场景中无法与 GPT-5.5、Claude 等支持视觉的模型直接竞争。
  • 预览版:作为早期预览,模型的稳定性和 API 可用性还需要观察后续正式版的更新。
  • 前端代码优势:有开发者实测反馈,在前端和 UI 代码生成场景中,Qwen3.6-Max 的表现优于 Claude Opus,但在后端逻辑和系统设计方面 Claude 仍有优势。这意味着模型选择应该基于具体任务而非笼统的”谁更强”。

行动建议

  • Agent 开发者:如果你有编程 Agent 的需求,Qwen3.6-Max-Preview 的智能体编程能力提升值得试用,特别是前端和代码生成场景。
  • 本地部署需求:Qwen3.6-27B 的 Apache 2.0 开源协议意味着商用免费且可二次微调,适合需要私有化部署的企业。
  • 多模态场景:如果工作需要图像理解或生成,目前需要搭配其他模型使用。

主要来源