C
ChaoBro

Tencent Hunyuan выпускает офлайн-модель перевода объёмом 440 МБ, 1,8 млрд параметров на уровне 72B

Tencent Hunyuan выпускает офлайн-модель перевода объёмом 440 МБ, 1,8 млрд параметров на уровне 72B

В незаметном уголке Tencent Hunyuan выпустила очень маленькую модель — всего 440 МБ, 1,8 млрд параметров.

Маленький размер — не главное преимущество. Заявлено, что качество перевода превосходит Tower-Plus-72B и Qwen3 35B.

Почему это важно

Модель на 72 млрд параметров в 40 раз больше, чем 1,8 млрд. Если качество перевода 1,8B соответствует или превышает модели 72B-уровня, это говорит о двух вещах:

Эффективность моделей для задачи перевода была серьёзно недооценена. Универсальные большие модели имеют огромный избыток параметров для перевода — параметры используются для генерации кода, логического рассуждения, креативного письма.

Офлайн-перевод на периферийных устройствах может быть переосмыслен. Модель объёмом 440 МБ легко помещается на мобильное устройство для локального вывода.

Ограничения

Это производительность только для задачи перевода. Модель 1,8B не может конкурировать с 72B в общих задачах.

Если вам нужна офлайн-способность перевода, эта модель заслуживает внимания.

Основные источники: обсуждение в X/Twitter