腾讯开源 1.8B 翻译模型：手机端直接跑，评分逼近 Qwen3-32B

大模型卷完之后，小模型战场正式开始。

腾讯低调开源了一个仅 1.8B 参数的翻译模型，提供 2bit 和 1.25bit 两个量化版本，直接在手机上就能跑，翻译质量评分却逼近 Qwen3-32B 的水平。

发生了什么

这个信号比单纯的”又一个开源模型”更有意思：

1. 专用小模型 > 通用大模型

1.8B 参数的翻译模型能达到 32B 通用模型的翻译水平，说明在垂直任务上，经过充分微调的小模型可以大幅压缩参数量而不损失质量。这背后的技术路径是：用大模型蒸馏 + 任务特定微调，把通用能力”浓缩”到小模型中。

2. 端侧部署成为现实

2bit 和 1.25bit 量化意味着模型权重可以被压缩到极小的体积：

这在手机端运行毫无压力，为离线翻译、隐私敏感场景提供了可行方案。

3. 大模型公司的新竞争维度

当所有公司都在拼参数规模、拼基准评测的时候，腾讯选择了一条差异化路线——把特定能力做到极致小。这本质上是对”模型即服务”范式的挑战：与其调一个大模型 API，不如在端侧部署一个小模型。