"Making ALL Software Agent-Native。"
一个 GitHub 项目的 README 上这么写,你第一反应可能是:又一个画大饼的。
但 CLI-Anything 已经在 GitHub 上拿到了 38,429 个星标,而且它的做法很务实——不是重新发明软件,而是给现有软件套一层「Agent 能理解的外壳」。
什么是 Agent-Native
先搞清楚这个词。
Agent-Native 不是说软件本身要重写。而是说,任何软件都应该能被 AI 代理直接操作,而不需要人类在中间当翻译。
现在的情况是:你想让 AI 代理用 Photoshop 修图、用 QGIS 做地图分析、用 Audacity 剪辑音频——基本上不可能。因为这些软件的操作界面是为人类手指和眼睛设计的,不是为代理的 API 调用设计的。
CLI-Anything 的思路是:给每个软件写一个 agent-harness(代理适配器)。这个适配器把软件的 CLI 接口标准化,让 AI 代理能用统一的方式调用任何软件。
他们已经做了什么
看仓库目录结构,CLI-Anything 已经有了大量现成的 agent-harness:
- 3MF —— 3D 模型处理
- QGIS —— 地理信息系统
- AdGuard Home —— 网络广告过滤
- Audacity —— 音频编辑
- Blender —— 3D 建模和渲染
每个 harness 都做了一件事:把软件的命令行接口包装成代理能理解和调用的标准格式。
举个例子,Audacity 的 agent-harness 能让 AI 代理执行「打开这个音频文件 → 降噪 → 导出 WAV」这样的操作序列,而不需要人工去点菜单。
为什么 CLI 是关键
你可能要问:为什么是 CLI?为什么不做 GUI 自动化?
原因很简单:CLI 是结构化的、确定性的、可脚本化的。GUI 自动化(基于图像识别或坐标点击)太脆弱——按钮换个位置就挂了,界面更新一下就废了。
CLI 是软件留给机器的后门。CLI-Anything 只是把这个后门标准化了。
CLI-Hub:生态野心
项目还有一个配套网站 clianything.cc,叫做 CLI-Hub。这是一个 agent-harness 的共享平台——类似 Docker Hub,但装的不是容器,是软件的代理适配器。
这个想法如果跑通了,会形成一个有趣的生态循环:
- 有人给一个新软件写了 agent-harness
- 上传到 CLI-Hub
- 其他人安装后,他们的 AI 代理就能操作这个软件
- 更多人用 → 更多人贡献 → 更多软件被支持
这和当年 npm/Docker Hub 的崛起路径很像。区别在于,这次不是管理代码/容器,而是管理软件的操作能力。
学术背景
CLI-Anything 来自香港大学的数据科学研究团队(HKUDS)。这不是一个周末项目,而是有论文支撑的研究工作。
学术团队做开源的好处是:方法论严谨,文档规范。坏处是:有时候更新节奏不如商业项目快。
从 commit 记录看,项目比较活跃(687 次提交,最近 3 小时还有更新),说明团队在持续投入。
局限性和挑战
CLI-Anything 不是万能药:
- 只覆盖有 CLI 的软件——很多消费级应用根本没有命令行接口
- harness 需要手动编写——虽然有框架辅助,但每个软件的 CLI 用法差异很大,自动化生成 harness 还不现实
- 复杂操作仍有局限——简单的任务(格式转换、批量处理)效果好,但涉及复杂交互的软件功能,代理仍然可能出错
值得关注的理由
CLI-Anything 最值得关注的不是它现在能做什么,而是它指向的方向:软件的可代理性(agentability)正在成为软件设计的一个新维度。
未来评估一个软件好不好用,可能不只是看界面美不美观、功能多不多,还要看它能不能被 AI 代理高效操作。
这就像当年「API 是否完善」成为评估 SaaS 产品的标准一样。CLI-Anything 正在为这个趋势提供基础设施。
主要来源: