Если революция языковых моделей большого объёма (LLM) 2024 года была посвящена вопросу «может ли модель писать код», то революция агентного ИИ 2026 года будет сосредоточена на том, как код, в свою очередь, управляет моделью — код перестаёт быть лишь выходным продуктом агента и превращается в его собственную «операционную систему».
Эта обзорная статья, написанная 42 авторами — включая исследователей из ведущих академических учреждений и индустриальных лабораторий, — сегодня возглавила рейтинг ежедневных статей Hugging Face (#1). В ней предложена единая теоретическая рамочная модель: «Код как средство управления агентами» (Code as Agent Harness).
Основной тезис
Центральная идея статьи чётко сформулирована: в новых агентных системах код вышел за рамки роли «целевого выходного результата» и стал носителем рассуждений, исполнителем действий, инструментом моделирования среды и инфраструктурой верификации на основе выполнения.
Авторы сводят этот переход к трём уровням:
Уровень первый: интерфейс средства управления (Harness Interface)
Каким образом код связывает агента с процессами рассуждения, действия и моделирования среды. Это не просто «вызов API» — код здесь выступает в качестве скелета цикла восприятия–принятия решений–действия агента.
Уровень второй: механизмы средства управления (Harness Mechanisms)
Здесь рассматриваются ключевые способности, необходимые для длительного выполнения задач:
- Планирование (Planning): как код организует декомпозицию задач и порядок их выполнения;
- Память (Memory): состояние кода как устойчивая, сохраняемая память;
- Использование инструментов (Tool Use): код как «клеевой» слой для вызова и оркестрации инструментов;
- Управление на основе обратной связи (Feedback-driven Control): адаптивная оптимизация на основе результатов выполнения.
Уровень третий: масштабирование до многоагентных систем (Scaling to Multi-Agent)
Когда код становится общим компонентом (shared code artifacts), координация, проверка и верификация между несколькими агентами получают единую семантическую основу. В статье обсуждаются открытые вызовы в этом направлении — особенно в контексте согласованности состояний между агентами и человеческого надзора за операциями, критичными с точки зрения безопасности.
Обзор областей применения
В статье систематизированы области применения кода в качестве средства управления агентами:
- Ассистенты программирования (Claude Code, Cursor и др.);
- Автоматизация графического интерфейса пользователя (GUI) и операционных систем (OS);
- Воплощённые агенты (Embodied Agents);
- Научные открытия;
- Персонализация и рекомендательные системы;
- DevOps;
- Корпоративные рабочие процессы.
Открытые вызовы
Статья не избегает острых вопросов. Несколько ключевых открытых проблем сформулированы предельно откровенно:
- Оценка должна выходить за рамки показателя успешности выполнения конечной задачи — необходимо оценивать качество промежуточных состояний и решений, принимаемых средством управления;
- Верификация при неполной обратной связи — как определить, «корректно ли» работает средство управления, если обратная связь от среды разрежена или зашумлена;
- Улучшение средства управления без регрессий — как гарантировать, что изменения в коде средства управления не приведут к деградации функциональности;
- Масштабирование на мультимодальные среды — текущая рамочная модель в первую очередь ориентирована на текстовые и кодовые среды.
Краткое резюме одной фразой
Ценность этой статьи заключается не в представлении какой-либо новой технологии, а в объединении разрозненных практических подходов «управления агентами посредством кода», существующих в разных областях, в единую теоретическую рамку. Для инженеров, создающих агентные ИИ-системы, эта «дорожная карта» представляет гораздо большую практическую ценность, чем любая отдельная научная публикация.
Статья и соответствующий исходный код уже открыты. Для разработчиков агентов это, возможно, один из самых важных обзоров года, заслуживающий самого внимательного прочтения.
Основной источник:
- arXiv:2605.18747 — обзорная статья «Code as Agent Harness»