Ключевой тезис
Линь Цзюньян, бывший технический руководитель команды Qwen (Tongyi Qianwen), после ухода в конце марта 2026 года впервые опубликовал систематическое суждение о направлении развития больших моделей: «Следующий этап больших моделей — не заставлять их думать дольше, а заставить их думать ради действия».
Линь непосредственно руководил технической разработкой серии Qwen3, что даёт ему первостепенное понимание эволюции технического маршрута Qwen. Его суждение — не академическая спекуляция, а вывод, сделанный на основе практики масштабного обучения и развёртывания моделей.
Почему «думать дольше» — не ответ
Основное направление текущей гонки больших моделей — увеличение времени рассуждений: от Chain-of-Thought до структурированного рассуждения серии o1 и различных подходов «длинного мышления». Но Линь указывает на фундаментальное ограничение этого пути:
| Измерение | Путь «думать дольше» | Путь «думать ради действия» |
|---|---|---|
| Цель | Повышение точности статических ответов | Повышение коэффициента выполнения динамических задач |
| Вывод | Длинные текстовые цепочки рассуждений | Выполняемые последовательности действий |
| Обратная связь | Офлайн-оценочные бенчмарки | Обратная связь от среды в реальном времени |
| Бутылочное горлышко | Стоимость вывода растёт экспоненциально | Эффективность действий и точность вызова инструментов |
| Потолок | Ограничено распределением данных обучения | Постоянно развивается через взаимодействие со средой |
Он подразумевает, что когда статическая способность модели к рассуждению пересекает определённый порог, предельная отдача от добавления шагов рассуждения резко снижается. Вместо того чтобы заставлять модель тратить 100 шагов рассуждения на вопрос, который она может проверить фактической операцией за 5 шагов, лучше натренировать её действовать напрямую.
Что это означает для экосистемы Qwen
Хотя Линь покинул компанию, его влияние на принятие решений в команде Qwen глубоко. Это суждение тесно согласуется с недавними техническими шагами Qwen:
- Фреймворк Qwen-Agent продолжает итерироваться: Команда Qwen последовательно укрепляет агентские способности, а не чистые языковые возможности модели
- Приоритет способности использования инструментов: Серия Qwen3 выделяется на бенчмарках tool-use — это не случайно
- Усиление мультимодального взаимодействия: Улучшение способностей визуального понимания напрямую обслуживает замкнутый цикл «увидеть→действовать»
Этот выбор маршрута создаёт дифференцированную конкуренцию с o-серией OpenAI на уровне агентских приложений: OpenAI делает ставку на длинные рассуждения, Qwen — на эффективность действий.
Суждение об индустриальном ландшафте
Предложение парадигмы «думать ради действия» отмечает важную отраслевую точку поворота:
- Системы оценки сместятся: От статических бенчмарков типа SWE-bench и MMLU к оценкам динамического взаимодействия со средой, таким как WebArena и OSWorld
- Архитектуры моделей изменятся: Движки рассуждений нуждаются в нативной поддержке форматов вывода действий, а не только текстового вывода
- Данные обучения расширятся: От чистых текстовых корпусов к журналам операций, траекториям вызова инструментов и изменениям состояния среды
Для разработчиков и корпоративных пользователей это означает, что критерии выбора модели должны сместиться с «кто отвечает точнее» на «кто выполняет лучше».
Рекомендации к действию
- При выборе моделей обращайте внимание на бенчмарки tool-use: Не только MMLU/GSM8K, но и BFCL, τ²-Bench и другие оценки вызова инструментов
- Приоритетно тестируйте интеграцию с агентскими фреймворками: Степень нативной поддержки Qwen-Agent, LangChain, OpenClaw напрямую влияет на эффективность развёртывания
- Резервируйте архитектурное пространство для агентизации: Даже если сегодня вы используете модели только для ответов на вопросы, архитектура вашей системы должна предусматривать интерфейсы для tool-use и вывода действий