Llama 3.1 405B 即将退役：开源大模型进入换代加速期

一个信号比一个新模型更值得注意。

微软在其 AI 模型维护策略文档中明确列出：Meta Llama 3.1 405B 将于 2026 年 5 月 15 日退役。推荐替换模型——OpenAI GPT-OSS 120B。

这不是某个云厂商的小调整。Llama 3.1 405B 是 2024 年开源模型社区的事实旗舰，也是过去一年开源生态的基石之一。它的退役，意味着开源模型的换代周期正在加速。

发生了什么

微软的维护策略文档列出了一个清晰的退役表格：

重点在最后一条推荐：用 OpenAI 的开源模型替换 Meta 的开源模型。

这在一年前几乎不可想象。当时 Llama 是开源模型领域的绝对霸主，OpenAI 的开源策略还在摇摆。现在 GPT-OSS 120B 成了云厂商眼中的 Llama 替代品。

Llama 3.1 405B 退役不是因为它"坏了"，而是因为新模型在同等或更低参数量下实现了更好的性能。GPT-OSS 120B 只有 Llama 3.1 405B 不到三分之一的参数量，但云厂商认为它足以替代。

这反映了一个趋势：开源模型的能力密度在快速提升。参数量不再是衡量开源模型能力的可靠指标——新模型用更少的参数做到了更多的事。

对开发者的直接影响：如果你的项目还在依赖 Llama 3.1 405B，5 月 15 日后需要迁移。迁移本身不复杂——换模型名称、微调 prompt、验证输出质量——但需要留出测试时间。

Llama 3.1 405B 的退役是开源模型生命周期缩短的一个缩影。一年前，一个开源旗舰模型可以稳坐两年江山。现在，换代周期压缩到了 6-12 个月。

这意味着：

如果你在企业环境里部署开源模型，现在应该开始考虑建立模型抽象层。不要把模型名称硬编码到业务逻辑里——用一个配置化的路由层来管理模型选择，换代时只需要改配置，不用改代码。

这不是"未来可能需要"的事。Llama 3.1 405B 退役就是"现在正在发生"的事。