上海交大 ARIS：让 AI 自己做研究，但不是让它随便跑

让 AI 自己跑研究，听起来很美好。但跑了一个月回头一看，结论立得住吗？证据链完整吗？还是模型自己脑补了一串看起来合理但经不起推敲的东西？

这是自主研究系统最核心的失败模式——不是显眼的崩溃，而是"看起来成功了但证据不足"。上海交大的研究团队在 5 月 4 日发布的 ARIS 论文，正面撞上了这个问题。

核心设计：一个干活，一个挑刺

ARIS 的全称是 "Autonomous Research via Adversarial Multi-Agent Collaboration"——对抗式多智能体协作自主研究。

架构很简单但不粗暴：一个执行器模型（executor）负责推进研究进度，一个来自不同模型家族的审查器模型（reviewer）负责批判中间产物并要求修改。默认配置就是对抗式的。

这个设计直觉上很对味。一个模型容易陷入自己的思维定势，换一家不同架构的模型来审查，盲区会少很多。就像写论文时找不同方向的同行评审，比找同门师兄更有用。

ARIS 不是简单地调个 API 让模型写论文。它有三层：

执行层提供了超过 65 个可复用的 Markdown 定义技能，通过 MCP 集成多种模型，还有一个持久的研究 wiki 用来迭代复用之前的发现。确定性图表生成也是个亮点——科研论文的图不能每次都长不一样。

编排层协调五个端到端工作流，支持可调的工作量设置和审查器模型路由。

保障层是这篇论文最值得看的地方。三阶段流程用来检查实验声明是否有证据支撑：完整性验证、结果到声明的映射、声明审计（将手稿陈述与声明账本和原始证据交叉核对）。外加五遍科学编辑流程和数学证明检查。

这个数据在 HuggingFace Daily Papers 上相当扎眼。说明社区对"AI 自主做研究"这件事的兴趣是实打实的，不是炒概念。

论文自己也说了，这是一个 prototype。self-improvement loop 记录的 research traces 需要经过 reviewer 批准才能被采纳——说明系统本身还不信任自己的改进建议。

更重要的是，对抗式审查能减少"看起来对但实际不对"的结论，但不能消除模型的知识边界。如果执行器和审查器都不知道某个领域的事实， adversarial 也救不了。

我比较关心的是：ARIS 跑出来的论文，和人类研究生花两周写的相比，质量差距在哪？是文献综述不够全面，还是实验设计有漏洞，还是写作表达有问题？

论文没有给出这个维度的对比。但如果有人拿 ARIS 跑一个已知结果的课题（比如复现某篇经典论文的实验），结果会很有意思。

主要来源：