大多数 AI Agent 工具面临的问题是:每个软件都要专门适配。
你想让 Agent 操作 Photoshop?写一个专门的插件。想操作 Excel?再写一个。想操作某个内部系统?再再写一个。
CLI-Anything 的解法是:不写插件了。
它让 AI Agent 直接通过命令行界面(CLI)操作任何软件。不需要 API、不需要 SDK、不需要专门的适配层。只要一个软件有 CLI——或者可以被包装出 CLI——Agent 就能操作它。
35,515 星。3,473 fork。来自香港大学数据科学实验室(HKUDS)。
"Agent-Native"是什么意思
先搞清楚概念。
"Agent-Native"不是"支持 AI"。很多软件说"支持 AI",意思是加了个聊天框或者某个 AI 功能。
Agent-Native 的意思是:这个软件的架构设计初衷就是让 AI Agent 能完全自主地操作它——理解它的状态、调用它的功能、处理它的输出。
CLI-Anything 提出的核心论点是:CLI 是最天然的 Agent-Native 接口。
为什么?
- CLI 有明确的输入输出格式
- CLI 操作是可组合的(管道、脚本)
- CLI 不需要图形界面解析——对 AI Agent 来说比 GUI 简单 100 倍
- CLI 是标准化的(flag、参数、stdin/stdout/stderr)
图形界面是给人类设计的,命令行是给机器设计的。AI Agent 本质上就是机器,所以 CLI 是它最自然的交互方式。
架构怎么工作
CLI-Anything 的核心是一个 CLI Hub——一个集中管理所有 CLI 工具注册和调用的中间层。
流程大致是:
- 注册:把任何 CLI 工具注册到 Hub 中,描述它的功能、参数、输出格式
- 理解:AI Agent 接收自然语言指令,翻译成 CLI 调用序列
- 执行:Hub 调度 CLI 执行,捕获输出
- 反馈:执行结果返回给 Agent,Agent 决定下一步
关键创新在于 自动化注册和描述生成。你不需要手动给每个 CLI 工具写文档——CLI-Anything 能自动分析 CLI 的 help 输出、man page、甚至实际执行样本来生成结构化的功能描述。
这解决了 Agent 工具生态最大的痛点:适配成本。
和现有方案的对比
MCP(Model Context Protocol):Anthropic 提出的标准,让 AI 模型能调用外部工具。但 MCP 需要每个工具开发者写一个 MCP Server。CLI-Anything 不需要——任何现有的 CLI 工具拿来就用。
LangChain Tools:需要 Python 代码定义工具。CLI-Anything 是语言无关的——CLI 本身就是跨语言的。
Function Calling:需要 API 端点。CLI-Anything 不需要 API,本地 CLI 就行。
RPA 工具:操作 GUI,慢且脆弱。CLI-Anything 直接操作命令行,快且稳定。
简单说:MCP/LangChain/Function Calling 需要"专门开发适配",CLI-Anything 说"别开发了,你现有的 CLI 就能用"。
数据说话
35,515 星的规模在 GitHub AI 工具领域属于头部。但更重要的是它的 fork 数和贡献者活跃度。
3,473 个 fork 说明很多人在基于它做自己的集成。commits 由多个贡献者推动(yuh-yang、AiMiDi、omerarslan0 等),不是单一维护者的项目。
来自 HKUDS(香港大学数据科学实验室)的背景也给了它学术可信度。这不是一个周末项目——背后有研究团队支撑。
局限性和风险
第一,CLI 不是万能的。 很多软件没有 CLI 接口,或者 CLI 功能有限。比如 Figma、Photoshop 这类图形软件,CLI 支持很弱。CLI-Anything 对这些软件无能为力。
第二,安全性。 让 AI Agent 直接执行 CLI 命令,本质上是给它 shell 访问权限。如果 Agent 被注入恶意指令,后果严重。项目需要完善的安全沙箱机制。
第三,复杂操作的编排。 简单的 git commit 没问题,但涉及多步、有条件分支、需要人类确认的操作,CLI-Anything 的编排能力是否足够?这需要实际场景检验。
我的看法
CLI-Anything 提出了一个被长期忽视的洞察:AI Agent 不需要完美的 API,它能理解 CLI 就够了。
这个思路的价值在于它降低了 Agent 生态的准入门槛。不需要每个软件都开发 AI 接口——CLI 就够了。而 CLI 已经存在了几十年,几乎所有的开发工具、运维工具、数据处理工具都有 CLI。
如果这个范式成立,AI Agent 的适用范围会从"专门适配的软件"扩展到"几乎所有有 CLI 的软件"。
这不是一个数量级的提升,是一个指数级的提升。
主要来源:
- HKUDS/CLI-Anything on GitHub — 35.5K stars, 3.5K forks
- CLI-Hub 官网
- 项目 README 和架构分析