IBM Granite 4.1 开源模型评测：小参数也能打

结论

IBM 于 2026 年 4 月 29 日发布 Granite 4.1 系列，包含 30B、8B 和 3B 三个非推理模型，全部采用 Apache 2.0 许可。在 Artificial Analysis 智能指数上，Granite 4.1 30B 得分 15，8B 得分 12，3B 得分 9，对标 Qwen3 和 Gemma3 级别的开源模型。

最大亮点是 token 效率：相对于同级别非推理模型，Granite 4.1 用更少的 token 完成相同任务。8B 版本在 token 效率与智能的平衡上表现尤为突出。

测试维度

智能指数对标

模型	参数规模	Artificial Analysis 得分
Granite 4.1-30B	30B	15
Granite 4.1-8B	8B	12
Granite 4.1-3B	3B	9

30B 版本的 15 分已达到主流中等规模开源模型水平，8B 版本的 12 分在小模型中属于第一梯队。

Token 效率

Granite 4.1 系列在 token 效率方面表现突出。相比同级别非推理模型，完成相同任务所需的 token 量更少。这意味着在实际部署中，推理成本更低、响应更快。

8B 版本在”token 效率 vs 智能”的权衡中表现最佳，适合需要平衡性能和成本的场景。

编码能力与 FIM 支持

Granite 4.1 支持 FIM（Fill-In-the-Middle）功能，这是代码补全的核心能力。开发者可以在已有代码中间插入补全内容，适用于 IDE 集成和代码辅助工具。

Apache 2.0 许可意味着企业可以免费商用，无需担心许可证风险。这对于需要本地部署、数据隐私要求高的企业场景尤为关键。

部署友好性

3B 版本适合边缘设备和低功耗场景，8B 版本适合单 GPU 部署，30B 版本适合需要更高智能的生产环境。三个版本覆盖从边缘到数据中心的完整部署光谱。

Weights & Biases Inference 已实现 Day-0 支持，可直接在 W&B 平台上进行推理测试和观测。

选择建议

企业商用/私有部署：Granite 4.1 全系列 Apache 2.0 许可，无商用限制，是 IBM 生态企业的首选
代码补全/IDE 集成：8B 版本 + FIM 支持，在效率和智能之间取得最佳平衡
边缘/低资源场景：3B 版本适合资源受限环境，9 分智能指数满足基础任务
追求性价比：8B 版本的 token 效率优势使其在同等成本下产出更高

结论

测试维度

智能指数对标

Token 效率

编码能力与 FIM 支持

部署友好性

选择建议

主要来源

相关内容

Kimi K2.6 登顶 Design Arena：月之暗面在 3D 设计领域超越所有美国模型

Qwen 3.6 Max BS Benchmark 评测：反幻觉能力超越所有 OpenAI 模型

Oxford/LLNL 链式推理基准：GPT 单项 95.7%，串联后暴跌至 9.83%