Qwen3.6 возглавляет Intelligence Index: 27B лидирует, но стоимость вывода в 21 раз выше Gemma 4

Вывод

После полного развертывания семейства Qwen3.6 в конце апреля 2026 года была представлена крайне противоречивая таблица результатов:

Qwen3.6-27B возглавляет Artificial Analysis Intelligence Index (open-source модели до 150B параметров) с результатом 46
Qwen3.6-35B квантованные версии достигают 95/92/73 tps на DGX-Spark, превосходя GPT-OSS-120B и Gemma 4 26B
Однако полное прохождение Intelligence Index требует примерно в 3.7 раза больше выходных токенов, а общая стоимость в 21 раз выше, чем у Gemma 4 31B

Модель	Intelligence Index	Параметры	Множитель токенов	Относительная стоимость
Qwen3.6-27B	46	27B	3.7x	21x
Gemma 4 31B	39	31B	1.0x	1.0x
Qwen3.6-35B (Q8)	—	35B	—	—
Qwen3.6-35B (Q6)	—	35B	—	—
Qwen3.6-35B (Q4)	—	35B	—	—

Источник: Artificial Analysis Intelligence Index, DGX-Spark Leaderboard (апрель 2026)

Qwen3.6-27B занимает первое место среди open-source моделей до 150B параметров. Более глубокий анализ показывает:

Аномально высокое потребление токенов: Qwen3.6-27B генерирует в 3.7 раза больше выходных токенов, чем Gemma 4 31B
Огромный разрыв в стоимости: Общая стоимость Qwen3.6 примерно в 21 раз выше Gemma 4
Квантованные версии дополняют: 35B Q8/Q6/Q4 модели последовательно появляются на DGX-Spark с результатами 95/92/73 tps

Даже квантованная Q4 версия модели 35B не может работать на RTX 3090/4090 (24GB VRAM) — возникает OOM. Потребителям требуется как минимум 40GB+ VRAM.

Релиз Qwen3.6 выявляет отраслевую тенденцию: стратегия «погони за лидербордами» open-source моделей сталкивается с осознанием стоимости.

Лагерь Qwen: максимизация баллов Intelligence Index за счет увеличения выходных токенов
Лагерь Gemma: легковесный подход, архитектура A4B позволяет многопоточный вывод на потребительском оборудовании
Средний путь: квантованные модели становятся практическим балансом между производительностью и стоимостью

Сценарий	Рекомендация	Причина
Академические исследования	Qwen3.6-27B	Высший балл Intelligence Index
Продакшн	Gemma 4 31B	В 21 раз дешевле, разница всего 7 баллов
Потребительское оборудование	Qwen3.6-35B Q4	Минимальное потребление VRAM
Лучшая цена/качество	Qwen3.6-35B Q6	92 tps, приемлемая потеря точности
Многопоточность	Gemma 4 26B A4B	Несколько инстансов на одном ноутбуке