ARIS от Шанхайского университета Цзяотун: ИИ как самостоятельный исследователь и амбиции состязательного многоагентного взаимодействия

Что в научных исследованиях занимает больше всего времени?

Не чтение литературы, не написание кода и не проведение экспериментов. Это связывание всех этих этапов в единый замкнутый цикл. Формулировка гипотезы, поиск литературы для её проверки, планирование эксперимента, анализ результатов, выявление недочётов, корректировка гипотезы — этот цикл требует огромных человеческих усилий по координации, и на каждом шаге процесс может застрять.

Проект ARIS Шанхайского университета Цзяотун стремится передать ИИ задачу автономного завершения этого цикла. Более того, его методология весьма необычна: вместо того чтобы поручить работу одному агенту, система заставляет нескольких агентов «противостоять» друг другу, сотрудничая через это противостояние.

Что такое ARIS

ARIS расшифровывается как "Autonomous Research via Adversarial Multi-Agent Collaboration" (Автономные исследования посредством многоагентного состязательного взаимодействия). Это не единая модель ИИ, а система, состоящая из множества агентов. Эти агенты выполняют разные роли: одни отвечают за выдвижение гипотез, другие — за критику, третьи — за экспериментальную проверку. Взаимодействуя в режиме состязательности, они продвигают исследования вперёд.

Эта методология вдохновлена реальным процессом научной деятельности. Качественные исследования редко рождаются в изоляции одного учёного; они оттачиваются в ходе академических дискуссий, рецензирования и многократных сомнений. ARIS закодировала эту логику «развития через противостояние» в многоагентную систему.

Проект набрал 116 голосов upvote на странице трендов Papers with Code и собрал 9.7k звёзд на GitHub, став одним из самых популярных проектов в области AI for Science в последнее время.

Состязательное взаимодействие vs. гармоничное сотрудничество

Многоагентные системы — не новая концепция. Многоагентную оркестровку поддерживает Claude от Anthropic, AutoGen от Microsoft также движется в этом направлении. Однако логика проектирования большинства существующих систем строится на «сотрудничестве»: несколько агентов распределяют задачи и каждый делает то, что умеет лучше всего.

Отличие ARIS заключается в «противостоянии». В систему введена роль критика, задача которого — не помогать, а искать изъяны. Он должен находить бреши в гипотезах, недостатки в дизайне экспериментов и чрезмерные выводы в заключениях.

Это кажется нелогичным, но именно в этом заключается суть науки. Научный прогресс движется не консенсусом «все согласны», а замечаниями «ты ошибаешься». Об этом и говорит попперовский «фальсификационизм».

Реальные возможности

На текущий момент ARIS демонстрирует следующие возможности:

Автономный обзор литературы: Агенты способны искать, читать и обобщать научные статьи
Генерация гипотез и критика: Выдвижение исследовательских гипотез с последующей проверкой их агентом-критиком
Планирование и проведение экспериментов: Автоматическая генерация кода, запуск экспериментов и анализ результатов
Итеративная оптимизация: Корректировка направления исследований на основе критических замечаний и результатов экспериментов

Разумеется, система ещё очень далека от замены исследователей-людей. Однако она открывает интригующую перспективу: ИИ может быть не просто «исполнителем» (получил задачу — выполнил её), а «исследователем» (сам обнаруживает проблемы, предлагает решения и проверяет гипотезы).

Сравнение с другими подходами

Параллельно аналогичные исследования ведут и другие команды. Например, проект Google DeepMind Gemini Deep Think также продвигает автономию ИИ в научных открытиях. Но подход DeepMind делает акцент на «глубоком мышлении единой модели», тогда как ARIS опирается на «состязательное взаимодействие множества агентов».

У каждого из подходов есть свои плюсы и минусы. Глубокое мышление одной модели проще контролировать и интерпретировать, однако при решении сложных задач оно может быть ограничено единственной точкой зрения. Состязательная многоагентная коллаборация способна генерировать более разнообразные идеи, но при этом повышает сложность системы и её непредсказуемость.

Моя оценка

Значимость ARIS заключается не в её текущих возможностях, а в том, что она доказывает: концепция «автономной науки» может перейти из разряда научной фантастики в область инженерной реализации.

Разумеется, путь предстоит долгий. Надёжность, интерпретируемость и безопасность состязательных многоагентных систем — всё это вопросы, требующие решения. Особенно в таких областях, как наука, где требования к строгости максимально высоки, «галлюцинации» и «излишняя самоуверенность» агентов могут оказаться фатальными.

Но вектор выбран верно. Если ИИ сможет взять на себя задачи по генерации гипотез и обобщению литературы, позволив учёным-людям сосредоточиться на ключевых инновациях, ценность направления AI for Science уже будет полностью реализована.

Амбиции состязательной коллаборации идут дальше: она стремится сделать ИИ не просто помощником человека, а полноценным «исследовательским партнёром», способным самостоятельно мыслить, подвергать сомнению и совершать открытия.

Насколько эта амбиция окажется реализуемой, покажет время.

Основные источники:

Papers with Code - ARIS

Что такое ARIS

Состязательное взаимодействие vs. гармоничное сотрудничество

Реальные возможности

Сравнение с другими подходами

Моя оценка

Похожие материалы

APWA: Распределённая архитектура для истинной параллелизации мультиагентных систем

Dual-Dimensional Consistency: новый метод, позволяющий сократить расход токенов при масштабировании во время вывода в 10 раз

MemEye: Визуально-ориентированная платформа оценки памяти мультимодальных агентов