结论
IBM 于 2026 年 4 月 29 日发布 Granite 4.1 系列,包含 30B、8B 和 3B 三个非推理模型,全部采用 Apache 2.0 许可。在 Artificial Analysis 智能指数上,Granite 4.1 30B 得分 15,8B 得分 12,3B 得分 9,对标 Qwen3 和 Gemma3 级别的开源模型。
最大亮点是 token 效率:相对于同级别非推理模型,Granite 4.1 用更少的 token 完成相同任务。8B 版本在 token 效率与智能的平衡上表现尤为突出。
测试维度
智能指数对标
| 模型 | 参数规模 | Artificial Analysis 得分 |
|---|---|---|
| Granite 4.1-30B | 30B | 15 |
| Granite 4.1-8B | 8B | 12 |
| Granite 4.1-3B | 3B | 9 |
30B 版本的 15 分已达到主流中等规模开源模型水平,8B 版本的 12 分在小模型中属于第一梯队。
Token 效率
Granite 4.1 系列在 token 效率方面表现突出。相比同级别非推理模型,完成相同任务所需的 token 量更少。这意味着在实际部署中,推理成本更低、响应更快。
8B 版本在”token 效率 vs 智能”的权衡中表现最佳,适合需要平衡性能和成本的场景。
编码能力与 FIM 支持
Granite 4.1 支持 FIM(Fill-In-the-Middle)功能,这是代码补全的核心能力。开发者可以在已有代码中间插入补全内容,适用于 IDE 集成和代码辅助工具。
Apache 2.0 许可意味着企业可以免费商用,无需担心许可证风险。这对于需要本地部署、数据隐私要求高的企业场景尤为关键。
部署友好性
3B 版本适合边缘设备和低功耗场景,8B 版本适合单 GPU 部署,30B 版本适合需要更高智能的生产环境。三个版本覆盖从边缘到数据中心的完整部署光谱。
Weights & Biases Inference 已实现 Day-0 支持,可直接在 W&B 平台上进行推理测试和观测。
选择建议
- 企业商用/私有部署:Granite 4.1 全系列 Apache 2.0 许可,无商用限制,是 IBM 生态企业的首选
- 代码补全/IDE 集成:8B 版本 + FIM 支持,在效率和智能之间取得最佳平衡
- 边缘/低资源场景:3B 版本适合资源受限环境,9 分智能指数满足基础任务
- 追求性价比:8B 版本的 token 效率优势使其在同等成本下产出更高