Что в научных исследованиях занимает больше всего времени?
Не чтение литературы, не написание кода и не проведение экспериментов. Это связывание всех этих этапов в единый замкнутый цикл. Формулировка гипотезы, поиск литературы для её проверки, планирование эксперимента, анализ результатов, выявление недочётов, корректировка гипотезы — этот цикл требует огромных человеческих усилий по координации, и на каждом шаге процесс может застрять.
Проект ARIS Шанхайского университета Цзяотун стремится передать ИИ задачу автономного завершения этого цикла. Более того, его методология весьма необычна: вместо того чтобы поручить работу одному агенту, система заставляет нескольких агентов «противостоять» друг другу, сотрудничая через это противостояние.
Что такое ARIS
ARIS расшифровывается как "Autonomous Research via Adversarial Multi-Agent Collaboration" (Автономные исследования посредством многоагентного состязательного взаимодействия). Это не единая модель ИИ, а система, состоящая из множества агентов. Эти агенты выполняют разные роли: одни отвечают за выдвижение гипотез, другие — за критику, третьи — за экспериментальную проверку. Взаимодействуя в режиме состязательности, они продвигают исследования вперёд.
Эта методология вдохновлена реальным процессом научной деятельности. Качественные исследования редко рождаются в изоляции одного учёного; они оттачиваются в ходе академических дискуссий, рецензирования и многократных сомнений. ARIS закодировала эту логику «развития через противостояние» в многоагентную систему.
Проект набрал 116 голосов upvote на странице трендов Papers with Code и собрал 9.7k звёзд на GitHub, став одним из самых популярных проектов в области AI for Science в последнее время.
Состязательное взаимодействие vs. гармоничное сотрудничество
Многоагентные системы — не новая концепция. Многоагентную оркестровку поддерживает Claude от Anthropic, AutoGen от Microsoft также движется в этом направлении. Однако логика проектирования большинства существующих систем строится на «сотрудничестве»: несколько агентов распределяют задачи и каждый делает то, что умеет лучше всего.
Отличие ARIS заключается в «противостоянии». В систему введена роль критика, задача которого — не помогать, а искать изъяны. Он должен находить бреши в гипотезах, недостатки в дизайне экспериментов и чрезмерные выводы в заключениях.
Это кажется нелогичным, но именно в этом заключается суть науки. Научный прогресс движется не консенсусом «все согласны», а замечаниями «ты ошибаешься». Об этом и говорит попперовский «фальсификационизм».
Реальные возможности
На текущий момент ARIS демонстрирует следующие возможности:
- Автономный обзор литературы: Агенты способны искать, читать и обобщать научные статьи
- Генерация гипотез и критика: Выдвижение исследовательских гипотез с последующей проверкой их агентом-критиком
- Планирование и проведение экспериментов: Автоматическая генерация кода, запуск экспериментов и анализ результатов
- Итеративная оптимизация: Корректировка направления исследований на основе критических замечаний и результатов экспериментов
Разумеется, система ещё очень далека от замены исследователей-людей. Однако она открывает интригующую перспективу: ИИ может быть не просто «исполнителем» (получил задачу — выполнил её), а «исследователем» (сам обнаруживает проблемы, предлагает решения и проверяет гипотезы).
Сравнение с другими подходами
Параллельно аналогичные исследования ведут и другие команды. Например, проект Google DeepMind Gemini Deep Think также продвигает автономию ИИ в научных открытиях. Но подход DeepMind делает акцент на «глубоком мышлении единой модели», тогда как ARIS опирается на «состязательное взаимодействие множества агентов».
У каждого из подходов есть свои плюсы и минусы. Глубокое мышление одной модели проще контролировать и интерпретировать, однако при решении сложных задач оно может быть ограничено единственной точкой зрения. Состязательная многоагентная коллаборация способна генерировать более разнообразные идеи, но при этом повышает сложность системы и её непредсказуемость.
Моя оценка
Значимость ARIS заключается не в её текущих возможностях, а в том, что она доказывает: концепция «автономной науки» может перейти из разряда научной фантастики в область инженерной реализации.
Разумеется, путь предстоит долгий. Надёжность, интерпретируемость и безопасность состязательных многоагентных систем — всё это вопросы, требующие решения. Особенно в таких областях, как наука, где требования к строгости максимально высоки, «галлюцинации» и «излишняя самоуверенность» агентов могут оказаться фатальными.
Но вектор выбран верно. Если ИИ сможет взять на себя задачи по генерации гипотез и обобщению литературы, позволив учёным-людям сосредоточиться на ключевых инновациях, ценность направления AI for Science уже будет полностью реализована.
Амбиции состязательной коллаборации идут дальше: она стремится сделать ИИ не просто помощником человека, а полноценным «исследовательским партнёром», способным самостоятельно мыслить, подвергать сомнению и совершать открытия.
Насколько эта амбиция окажется реализуемой, покажет время.
Основные источники: