Развёртывание китайских больших языковых моделей на зарубежных платформах вывода продолжает ускоряться. В конце апреля 2026 года Qwen3.6-Plus официально заработал на платформе Together AI, позволив разработчикам напрямую вызывать модель через стандартный OpenAI-совместимый API без необходимости самостоятельного развёртывания.
Что произошло
Together AI в настоящее время является одной из крупнейших сторонних платформ агрегации вывода моделей, предоставляя разработчикам единый интерфейс API для доступа к моделям различных поставщиков. Появление Qwen3.6-Plus на платформе означает:
- Готовность к использованию: Не требуются GPU или настройка файлов весов; модель можно вызывать напрямую через стандартный API
- Автоматическое масштабирование: Инфраструктура вывода Together AI автоматически обрабатывает конкурентные запросы и балансировку нагрузки
- OpenAI-совместимый интерфейс: Существующий код не требует модификаций; достаточно переключить
base_urlи имя модели
Текущая позиция экосистемы серии Qwen3.6
Серия Qwen3.6 — это семейство флагманских моделей, выпущенное командой Tongyi Qianwen компании Alibaba в апреле 2026 года, включающее несколько спецификаций:
| Версия модели | Параметры | Позиционирование | Ключевые особенности |
|---|---|---|---|
| Qwen3.6-35B-A3B | 35B всего / 3B активных | Эффективный вывод | Архитектура MoE, крайне низкая стоимость вывода |
| Qwen3.6-27B | 27B | Универсальный среднего класса | Оптимальное соотношение цена/качество |
| Qwen3.6-Plus | Не раскрыто | Флагманский | Комплексные возможности на уровне лучших флагманов |
Будучи флагманской моделью в серии, Qwen3.6-Plus вошёл в десятку лучших в мире в таких открытых оценках, как LMSys Chatbot Arena, демонстрируя особенно выдающиеся результаты в понимании китайского языка, генерации кода и математических рассуждениях.
Почему развёртывание на Together AI важно
По сравнению с предыдущими каналами распространения серии Qwen3.6, которые в основном опирались на платформу Alibaba Cloud Bailian и Hugging Face, этот запуск на Together AI имеет несколько ключевых значений:
- Снижение порога доступа для зарубежных пользователей: Основная аудитория Together AI сосредоточена в Северной Америке и Европе. Запуск Qwen3.6-Plus позволяет этим разработчикам испытать китайские модели без барьеров
- Интеграция API-экосистемы: Together AI поддерживает гибридную оркестровку Qwen3.6-Plus вместе с другими моделями, такими как Claude и GPT, облегчая разработку многомодельных рабочих процессов
- Коммерческий сигнал: Готовность сторонней платформы вывода интегрировать и продвигать модели Qwen указывает на их конкурентоспособность по производительности и стоимости
Оценка конкурентного ландшафта
Текущая ситуация с развёртыванием китайских моделей на основных платформах вывода:
| Платформа | Интегрированные китайские модели |
|---|---|
| Together AI | Qwen3.6-Plus, Qwen3.6-27B, DeepSeek V4 |
| OpenRouter | Полная серия Qwen3.6, DeepSeek V4, MiniMax |
| Groq | Qwen3.6-27B (сверхбыстрый вывод) |
| Alibaba Cloud Bailian | Полная серия Qwen (эксклюзивный доступ к новейшим) |
Несмотря на то, что серия Qwen уже имеет широкое покрытие на сторонних платформах, её доступность на Together AI остаётся знаковым событием — это признание способностей китайских моделей со стороны ведущей мировой платформы агрегации вывода.
Рекомендации к действию
- Существующие пользователи Together AI: Напрямую вызывайте модель
Qwen/Qwen3.6-Plus. Поддерживаются потоковый вывод и вызов инструментов - Оценка выбора модели: Рассмотрите добавление Qwen3.6-Plus в пул кандидатов для A/B-тестирования, особенно для китайскоязычных или многоязычных задач
- Сценарии с чувствительностью к стоимости: Рекомендуется одновременно тестировать Qwen3.6-27B и Qwen3.6-35B-A3B. Последняя может предложить более низкую стоимость вывода благодаря архитектуре MoE