Вывод: нижний предел цен на модели с триллионом параметров пересмотрен
27 апреля 2026 года модель Qwen 3.6 Max Preview от Alibaba Tongyi Qwen официально появилась на платформе OpenRouter.
Ключевые характеристики:
| Параметр | Значение |
|---|---|
| Количество параметров | 1 триллион (разреженная архитектура MoE) |
| Размер контекстного окна | 262 тыс. токенов |
| Стоимость входных токенов | $1,30 за миллион токенов |
| Стоимость выходных токенов | $7,80 за миллион токенов |
| Доступ к весам | ❌ Закрытый исходный код |
| Основные направления оптимизации | Агентное программирование (Agentic Coding), вызов инструментов |
Это не очередная история «чем больше параметров — тем выше цена». Стоимость входных токенов Qwen 3.6 Max Preview составляет всего 35 % от стоимости входных токенов GPT-5.5, а стоимость выходных токенов — лишь 31 % от стоимости выходных токенов Claude Opus 4.7.
Сравнение цен: кто действительно ведёт ценовую войну?
| Модель | Количество параметров | Стоимость входных токенов | Стоимость выходных токенов | Контекстное окно |
|---|---|---|---|---|
| Qwen 3.6 Max Preview | 1 Т (MoE) | $1,30 | $7,80 | 262K |
| GPT-5.5 | Не раскрывается | $3,75 | $25,00 | 2 млн |
| Claude Opus 4.7 | Не раскрывается | $5,00 | $25,00 | 200 тыс. |
| Gemini 2.5 Pro | Не раскрывается | $2,50 | $15,00 | 1 млн |
| DeepSeek V4 Pro | 671 млрд (MoE) | $1,50 | $6,00 | 128 тыс. |
Стратегия ценообразования Qwen 3.6 Max Preview чётко выражена: предложить производительность уровня моделей с триллионом параметров по цене, близкой к цене DeepSeek V4 Pro. Учитывая результаты Qwen Max в тестах SWE-bench и других оценках качества программирования, такая цена делает её чрезвычайно привлекательным выбором для разработчиков.
Значение появления на OpenRouter
До этого момента Qwen 3.6 Max Preview можно было использовать только через API DashScope от Alibaba Cloud. Размещение на OpenRouter означает:
- Прямой доступ для разработчиков по всему миру, без необходимости регистрации в Alibaba Cloud или решения вопросов международных платежей;
- Возможность прямого сравнения с моделями Claude, GPT и Gemini на одной платформе, что наглядно демонстрирует различия в производительности;
- Гибкость маршрутизации: автоматическое переключение между Qwen Max, GPT-5.5 и Claude Opus в зависимости от типа задачи.
Позиционирование по производительности: что означает метка «Preview» для модели с триллионом параметров?
Метка «Preview» указывает на то, что это ещё не финальная версия. Однако уже опубликованные результаты тестов показывают следующее:
- SWE-bench Verified: модель находится в одной группе лидеров с GPT-5.5 и Claude Opus 4.7;
- Agentic Coding: специально оптимизирована под сценарии вызова инструментов и работы агентов-программистов;
- Разреженная MoE-архитектура: общее количество параметров — 1 триллион, однако при реальном выводе активируется лишь часть параметров, что объясняет возможность сохранить высокую производительность уровня триллионной модели при одновременном снижении стоимости.
Как её можно использовать
- Задачи анализа длинных текстов: контекстное окно в 262 тыс. токенов в сочетании с триллионом параметров идеально подходит для обработки сверхдлинных кодовых баз, юридических документов и технических руководств;
- Конвейеры агентного программирования (Agentic Coding Pipeline): благодаря специальной оптимизации под вызов инструментов модель отлично подходит в качестве узла программирования внутри рабочих процессов агентов;
- Продуктивные сценарии с жёсткими ограничениями по бюджету: если вашему приложению не требуется контекстное окно GPT-5.5 объёмом 2 млн токенов, Qwen 3.6 Max предлагает эквивалентный уровень интеллектуальных возможностей при снижении затрат на 60 %.
Стратегическая оценка
Появление Qwen 3.6 Max Preview на OpenRouter — ключевой шаг в международной стратегии AI-направления Alibaba. Это знаменует переход китайских разработчиков крупных языковых моделей от ориентации исключительно на внутренний рынок к прямому соперничеству с американскими технологическими гигантами на международном рынке API-сервисов и ценового формирования.
Для разработчиков это отличная новость: возможности моделей с триллионом параметров становятся общественной услугой, а их цена стремительно приближается к уровню «коммунальных тарифов». Сегодня стоимость одного вызова GPT-4 в 2024 году позволяет вызвать модель с триллионом параметров целых 50 раз.