Вывод
После полного развертывания семейства Qwen3.6 в конце апреля 2026 года была представлена крайне противоречивая таблица результатов:
- Qwen3.6-27B возглавляет Artificial Analysis Intelligence Index (open-source модели до 150B параметров) с результатом 46
- Qwen3.6-35B квантованные версии достигают 95/92/73 tps на DGX-Spark, превосходя GPT-OSS-120B и Gemma 4 26B
- Однако полное прохождение Intelligence Index требует примерно в 3.7 раза больше выходных токенов, а общая стоимость в 21 раз выше, чем у Gemma 4 31B
Обзор данных Intelligence Index
| Модель | Intelligence Index | Параметры | Множитель токенов | Относительная стоимость |
|---|---|---|---|---|
| Qwen3.6-27B | 46 | 27B | 3.7x | 21x |
| Gemma 4 31B | 39 | 31B | 1.0x | 1.0x |
| Qwen3.6-35B (Q8) | — | 35B | — | — |
| Qwen3.6-35B (Q6) | — | 35B | — | — |
| Qwen3.6-35B (Q4) | — | 35B | — | — |
Источник: Artificial Analysis Intelligence Index, DGX-Spark Leaderboard (апрель 2026)
Qwen3.6-27B занимает первое место среди open-source моделей до 150B параметров. Более глубокий анализ показывает:
- Аномально высокое потребление токенов: Qwen3.6-27B генерирует в 3.7 раза больше выходных токенов, чем Gemma 4 31B
- Огромный разрыв в стоимости: Общая стоимость Qwen3.6 примерно в 21 раз выше Gemma 4
- Квантованные версии дополняют: 35B Q8/Q6/Q4 модели последовательно появляются на DGX-Spark с результатами 95/92/73 tps
Квантованные модели: входной билет для потребительского оборудования
- Q8 (8-bit): 95 tps — минимальная потеря точности
- Q6 (6-bit): 92 tps — лучшее соотношение цена/качество
- Q4 (4-bit): 73 tps — минимальное потребление VRAM
Даже квантованная Q4 версия модели 35B не может работать на RTX 3090/4090 (24GB VRAM) — возникает OOM. Потребителям требуется как минимум 40GB+ VRAM.
Оценка ландшафта
Релиз Qwen3.6 выявляет отраслевую тенденцию: стратегия «погони за лидербордами» open-source моделей сталкивается с осознанием стоимости.
- Лагерь Qwen: максимизация баллов Intelligence Index за счет увеличения выходных токенов
- Лагерь Gemma: легковесный подход, архитектура A4B позволяет многопоточный вывод на потребительском оборудовании
- Средний путь: квантованные модели становятся практическим балансом между производительностью и стоимостью
Рекомендации
| Сценарий | Рекомендация | Причина |
|---|---|---|
| Академические исследования | Qwen3.6-27B | Высший балл Intelligence Index |
| Продакшн | Gemma 4 31B | В 21 раз дешевле, разница всего 7 баллов |
| Потребительское оборудование | Qwen3.6-35B Q4 | Минимальное потребление VRAM |
| Лучшая цена/качество | Qwen3.6-35B Q6 | 92 tps, приемлемая потеря точности |
| Многопоточность | Gemma 4 26B A4B | Несколько инстансов на одном ноутбуке |