CLI-Anything：HKUDS 想让所有软件变成 Agent-Native，35K 星背后是一场架构革命

大多数 AI Agent 工具面临的问题是：每个软件都要专门适配。

你想让 Agent 操作 Photoshop？写一个专门的插件。想操作 Excel？再写一个。想操作某个内部系统？再再写一个。

CLI-Anything 的解法是：不写插件了。

它让 AI Agent 直接通过命令行界面（CLI）操作任何软件。不需要 API、不需要 SDK、不需要专门的适配层。只要一个软件有 CLI——或者可以被包装出 CLI——Agent 就能操作它。

35,515 星。3,473 fork。来自香港大学数据科学实验室（HKUDS）。

"Agent-Native"是什么意思

先搞清楚概念。

"Agent-Native"不是"支持 AI"。很多软件说"支持 AI"，意思是加了个聊天框或者某个 AI 功能。

Agent-Native 的意思是：这个软件的架构设计初衷就是让 AI Agent 能完全自主地操作它——理解它的状态、调用它的功能、处理它的输出。

CLI-Anything 提出的核心论点是：CLI 是最天然的 Agent-Native 接口。

为什么？

CLI 有明确的输入输出格式
CLI 操作是可组合的（管道、脚本）
CLI 不需要图形界面解析——对 AI Agent 来说比 GUI 简单 100 倍
CLI 是标准化的（flag、参数、stdin/stdout/stderr）

图形界面是给人类设计的，命令行是给机器设计的。AI Agent 本质上就是机器，所以 CLI 是它最自然的交互方式。

架构怎么工作

CLI-Anything 的核心是一个 CLI Hub——一个集中管理所有 CLI 工具注册和调用的中间层。

流程大致是：

注册：把任何 CLI 工具注册到 Hub 中，描述它的功能、参数、输出格式
理解：AI Agent 接收自然语言指令，翻译成 CLI 调用序列
执行：Hub 调度 CLI 执行，捕获输出
反馈：执行结果返回给 Agent，Agent 决定下一步

关键创新在于 自动化注册和描述生成。你不需要手动给每个 CLI 工具写文档——CLI-Anything 能自动分析 CLI 的 help 输出、man page、甚至实际执行样本来生成结构化的功能描述。

这解决了 Agent 工具生态最大的痛点：适配成本。

和现有方案的对比

MCP（Model Context Protocol）：Anthropic 提出的标准，让 AI 模型能调用外部工具。但 MCP 需要每个工具开发者写一个 MCP Server。CLI-Anything 不需要——任何现有的 CLI 工具拿来就用。

LangChain Tools：需要 Python 代码定义工具。CLI-Anything 是语言无关的——CLI 本身就是跨语言的。

Function Calling：需要 API 端点。CLI-Anything 不需要 API，本地 CLI 就行。

RPA 工具：操作 GUI，慢且脆弱。CLI-Anything 直接操作命令行，快且稳定。

简单说：MCP/LangChain/Function Calling 需要"专门开发适配"，CLI-Anything 说"别开发了，你现有的 CLI 就能用"。

数据说话

35,515 星的规模在 GitHub AI 工具领域属于头部。但更重要的是它的 fork 数和贡献者活跃度。

3,473 个 fork 说明很多人在基于它做自己的集成。commits 由多个贡献者推动（yuh-yang、AiMiDi、omerarslan0 等），不是单一维护者的项目。

来自 HKUDS（香港大学数据科学实验室）的背景也给了它学术可信度。这不是一个周末项目——背后有研究团队支撑。

局限性和风险

第一，CLI 不是万能的。 很多软件没有 CLI 接口，或者 CLI 功能有限。比如 Figma、Photoshop 这类图形软件，CLI 支持很弱。CLI-Anything 对这些软件无能为力。

第二，安全性。 让 AI Agent 直接执行 CLI 命令，本质上是给它 shell 访问权限。如果 Agent 被注入恶意指令，后果严重。项目需要完善的安全沙箱机制。

第三，复杂操作的编排。 简单的 git commit 没问题，但涉及多步、有条件分支、需要人类确认的操作，CLI-Anything 的编排能力是否足够？这需要实际场景检验。

我的看法

CLI-Anything 提出了一个被长期忽视的洞察：AI Agent 不需要完美的 API，它能理解 CLI 就够了。

这个思路的价值在于它降低了 Agent 生态的准入门槛。不需要每个软件都开发 AI 接口——CLI 就够了。而 CLI 已经存在了几十年，几乎所有的开发工具、运维工具、数据处理工具都有 CLI。

如果这个范式成立，AI Agent 的适用范围会从"专门适配的软件"扩展到"几乎所有有 CLI 的软件"。

这不是一个数量级的提升，是一个指数级的提升。

主要来源：

HKUDS/CLI-Anything on GitHub — 35.5K stars, 3.5K forks
CLI-Hub 官网
项目 README 和架构分析

"Agent-Native"是什么意思

架构怎么工作

和现有方案的对比

数据说话

局限性和风险

我的看法

Related

CloakBrowser：30/30 反检测测试全通过的隐身浏览器，18,500 星

CodeGraph：让 Claude Code 和 Cursor 省 35% Token 的代码知识图谱工具

Cognee：6 行代码给 AI Agent 装上记忆系统，17k star 的背后是刚需