C
ChaoBro

CLI-Anything:HKUDS 想让所有软件变成 Agent-Native,35K 星背后是一场架构革命

CLI-Anything:HKUDS 想让所有软件变成 Agent-Native,35K 星背后是一场架构革命

大多数 AI Agent 工具面临的问题是:每个软件都要专门适配。

你想让 Agent 操作 Photoshop?写一个专门的插件。想操作 Excel?再写一个。想操作某个内部系统?再再写一个。

CLI-Anything 的解法是:不写插件了。

它让 AI Agent 直接通过命令行界面(CLI)操作任何软件。不需要 API、不需要 SDK、不需要专门的适配层。只要一个软件有 CLI——或者可以被包装出 CLI——Agent 就能操作它。

35,515 星。3,473 fork。来自香港大学数据科学实验室(HKUDS)。

"Agent-Native"是什么意思

先搞清楚概念。

"Agent-Native"不是"支持 AI"。很多软件说"支持 AI",意思是加了个聊天框或者某个 AI 功能。

Agent-Native 的意思是:这个软件的架构设计初衷就是让 AI Agent 能完全自主地操作它——理解它的状态、调用它的功能、处理它的输出。

CLI-Anything 提出的核心论点是:CLI 是最天然的 Agent-Native 接口

为什么?

  • CLI 有明确的输入输出格式
  • CLI 操作是可组合的(管道、脚本)
  • CLI 不需要图形界面解析——对 AI Agent 来说比 GUI 简单 100 倍
  • CLI 是标准化的(flag、参数、stdin/stdout/stderr)

图形界面是给人类设计的,命令行是给机器设计的。AI Agent 本质上就是机器,所以 CLI 是它最自然的交互方式。

架构怎么工作

CLI-Anything 的核心是一个 CLI Hub——一个集中管理所有 CLI 工具注册和调用的中间层。

流程大致是:

  1. 注册:把任何 CLI 工具注册到 Hub 中,描述它的功能、参数、输出格式
  2. 理解:AI Agent 接收自然语言指令,翻译成 CLI 调用序列
  3. 执行:Hub 调度 CLI 执行,捕获输出
  4. 反馈:执行结果返回给 Agent,Agent 决定下一步

关键创新在于 自动化注册和描述生成。你不需要手动给每个 CLI 工具写文档——CLI-Anything 能自动分析 CLI 的 help 输出、man page、甚至实际执行样本来生成结构化的功能描述。

这解决了 Agent 工具生态最大的痛点:适配成本

和现有方案的对比

MCP(Model Context Protocol):Anthropic 提出的标准,让 AI 模型能调用外部工具。但 MCP 需要每个工具开发者写一个 MCP Server。CLI-Anything 不需要——任何现有的 CLI 工具拿来就用。

LangChain Tools:需要 Python 代码定义工具。CLI-Anything 是语言无关的——CLI 本身就是跨语言的。

Function Calling:需要 API 端点。CLI-Anything 不需要 API,本地 CLI 就行。

RPA 工具:操作 GUI,慢且脆弱。CLI-Anything 直接操作命令行,快且稳定。

简单说:MCP/LangChain/Function Calling 需要"专门开发适配",CLI-Anything 说"别开发了,你现有的 CLI 就能用"。

数据说话

35,515 星的规模在 GitHub AI 工具领域属于头部。但更重要的是它的 fork 数和贡献者活跃度。

3,473 个 fork 说明很多人在基于它做自己的集成。commits 由多个贡献者推动(yuh-yang、AiMiDi、omerarslan0 等),不是单一维护者的项目。

来自 HKUDS(香港大学数据科学实验室)的背景也给了它学术可信度。这不是一个周末项目——背后有研究团队支撑。

局限性和风险

第一,CLI 不是万能的。 很多软件没有 CLI 接口,或者 CLI 功能有限。比如 Figma、Photoshop 这类图形软件,CLI 支持很弱。CLI-Anything 对这些软件无能为力。

第二,安全性。 让 AI Agent 直接执行 CLI 命令,本质上是给它 shell 访问权限。如果 Agent 被注入恶意指令,后果严重。项目需要完善的安全沙箱机制。

第三,复杂操作的编排。 简单的 git commit 没问题,但涉及多步、有条件分支、需要人类确认的操作,CLI-Anything 的编排能力是否足够?这需要实际场景检验。

我的看法

CLI-Anything 提出了一个被长期忽视的洞察:AI Agent 不需要完美的 API,它能理解 CLI 就够了

这个思路的价值在于它降低了 Agent 生态的准入门槛。不需要每个软件都开发 AI 接口——CLI 就够了。而 CLI 已经存在了几十年,几乎所有的开发工具、运维工具、数据处理工具都有 CLI。

如果这个范式成立,AI Agent 的适用范围会从"专门适配的软件"扩展到"几乎所有有 CLI 的软件"。

这不是一个数量级的提升,是一个指数级的提升。


主要来源: