C
ChaoBro

GenericAgent:3300 行种子代码长出一棵技能树,Agent 开始自己进化了

GenericAgent:3300 行种子代码长出一棵技能树,Agent 开始自己进化了

GitHub 上有个叫 GenericAgent 的项目,描述很直白:"Self-evolving agent: grows skill tree from 3.3K-line seed, achieving full system control with 6x less token consumption。" 10,221 星,今天一天涨了 577 星。585 次 commit,最新一次提交在 1 小时前。

先看数字,再说这玩意儿到底在做什么。

核心思路:Agent 不应该靠人喂 prompt,应该自己长能力

大多数 Agent 框架的工作方式是:开发者写好工具列表、写好 prompt 模板、定义好工作流,然后 Agent 在这个框架里跑。本质上 Agent 的能力上限取决于开发者往里面塞了多少东西。

GenericAgent 反过来:它从一个 3300 行的种子代码出发,自己构建一棵技能树。技能树不是一开始定义好的,而是在和系统交互的过程中生长出来的。遇到新场景,它自己判断需要什么能力,然后生成对应的 skill 节点。

官方声称这样带来的好处是 token 消耗降低 6 倍。逻辑也说得通:传统方式每次都要带上完整的工具描述和上下文,而技能树方式只需要加载当前任务相关的 skill 分支,自然省 token。

实际看仓库

几个值得注意的细节:

活跃度很高。585 次 commit,1 小时前还有更新。issue 区 39 个,PR 20 个,说明社区参与度不低。作者 lsdefine 的提交节奏几乎是每天都有。

中文社区基因明显。README 里有飞书显示相关的处理(replace alarming warning with neutral "(无文本输出)" in feishu display),文档目录中有微信群二维码更新。这不是一个面向海外社区的纯英文项目,而是扎根于中文开发者生态。

模块结构清晰。仓库分成了 memory(记忆模块)、plugins(插件)、frontends(前端)、reflect(反思工作流)几个主要目录。reflect 目录昨天刚加了轻量级的 goal mode reflect workflow,说明项目还在快速迭代能力边界。

6x token 节省怎么来的

这个数据需要打个问号。官方没有给出完整的 benchmark 报告(至少我在 README 和 issues 里没有看到第三方的复现结果)。但从设计思路上看,token 节省的逻辑链条是清晰的:

  1. 传统方式:每次调用 Agent 都加载全部工具描述(可能几十上百个工具)
  2. 技能树方式:只加载与当前目标相关的 skill 分支(可能只有几个节点)
  3. 自进化意味着不需要的 skill 会被修剪,进一步减少上下文大小

如果这个逻辑在真实工作负载中成立,6x 是可能的。但建议你自己跑一下你的场景——不同任务的 skill 树分支密度差异很大。

值不值得试

值得,但有两个前提:

第一,你的场景有明确的"技能"可分。如果你的 Agent 总是做同一类事情,技能树的优势不大;如果它需要跨多种任务切换(比如既要写代码又要查数据库又要生成报告),技能树的路径选择才有意义。

第二,你有一定的中文环境适配需求。这个项目的文档和社区主要在中文生态,如果你需要英文优先的支持,可能要等一等。

一句话:自进化 Agent 这个方向不是新概念,但 GenericAgent 把技能树和 token 效率绑在一起讲了一个完整的故事,而且代码是真的在跑。装上试试不亏。

主要来源: