Qwen3.6 возглавляет Intelligence Index: 27B лидирует, но стоимость вывода в 21 раз выше Gemma 4

Qwen3.6 возглавляет Intelligence Index: 27B лидирует, но стоимость вывода в 21 раз выше Gemma 4

Вывод

После полного развертывания семейства Qwen3.6 в конце апреля 2026 года была представлена крайне противоречивая таблица результатов:

  • Qwen3.6-27B возглавляет Artificial Analysis Intelligence Index (open-source модели до 150B параметров) с результатом 46
  • Qwen3.6-35B квантованные версии достигают 95/92/73 tps на DGX-Spark, превосходя GPT-OSS-120B и Gemma 4 26B
  • Однако полное прохождение Intelligence Index требует примерно в 3.7 раза больше выходных токенов, а общая стоимость в 21 раз выше, чем у Gemma 4 31B

Обзор данных Intelligence Index

МодельIntelligence IndexПараметрыМножитель токеновОтносительная стоимость
Qwen3.6-27B4627B3.7x21x
Gemma 4 31B3931B1.0x1.0x
Qwen3.6-35B (Q8)35B
Qwen3.6-35B (Q6)35B
Qwen3.6-35B (Q4)35B

Источник: Artificial Analysis Intelligence Index, DGX-Spark Leaderboard (апрель 2026)

Qwen3.6-27B занимает первое место среди open-source моделей до 150B параметров. Более глубокий анализ показывает:

  1. Аномально высокое потребление токенов: Qwen3.6-27B генерирует в 3.7 раза больше выходных токенов, чем Gemma 4 31B
  2. Огромный разрыв в стоимости: Общая стоимость Qwen3.6 примерно в 21 раз выше Gemma 4
  3. Квантованные версии дополняют: 35B Q8/Q6/Q4 модели последовательно появляются на DGX-Spark с результатами 95/92/73 tps

Квантованные модели: входной билет для потребительского оборудования

  • Q8 (8-bit): 95 tps — минимальная потеря точности
  • Q6 (6-bit): 92 tps — лучшее соотношение цена/качество
  • Q4 (4-bit): 73 tps — минимальное потребление VRAM

Даже квантованная Q4 версия модели 35B не может работать на RTX 3090/4090 (24GB VRAM) — возникает OOM. Потребителям требуется как минимум 40GB+ VRAM.

Оценка ландшафта

Релиз Qwen3.6 выявляет отраслевую тенденцию: стратегия «погони за лидербордами» open-source моделей сталкивается с осознанием стоимости.

  • Лагерь Qwen: максимизация баллов Intelligence Index за счет увеличения выходных токенов
  • Лагерь Gemma: легковесный подход, архитектура A4B позволяет многопоточный вывод на потребительском оборудовании
  • Средний путь: квантованные модели становятся практическим балансом между производительностью и стоимостью

Рекомендации

СценарийРекомендацияПричина
Академические исследованияQwen3.6-27BВысший балл Intelligence Index
ПродакшнGemma 4 31BВ 21 раз дешевле, разница всего 7 баллов
Потребительское оборудованиеQwen3.6-35B Q4Минимальное потребление VRAM
Лучшая цена/качествоQwen3.6-35B Q692 tps, приемлемая потеря точности
МногопоточностьGemma 4 26B A4BНесколько инстансов на одном ноутбуке