C
ChaoBro

给 AI 编程工具装上"记忆宫殿":codegraph 如何让 Claude Code 少烧一半 token

每次用 Claude Code、Cursor 或 Codex 处理一个大项目,你都能感受到那种「慢性烧钱」的痛:代理要理解项目结构,先得逐个文件读取;要定位某个函数的调用关系,得翻遍十几个文件;改一行代码,它可能读了 20 个文件才敢下手。

这就是 codegraph 想解决的问题——不是让模型更聪明,而是让它不用读那么多东西。

知识图谱的思路,用在代码上

codegraph 的核心想法其实不复杂:与其让 AI 代理每次进来都重新读一遍代码,不如事先把代码库的关系结构提取出来,建成一个图数据库。

这个图里存的是什么?函数之间的调用关系、类的继承链、模块间的依赖——说白了就是你在 IDE 里按 Cmd+Click 跳转时看到的那些东西,只不过被结构化、索引化了。

当 AI 代理需要理解某个函数时,它不用再去 grep、不用再去读整个文件,直接查询图谱:谁调了我、我调了谁、我的入参来自哪里。几毫秒,完事。

数字很直观

项目 README 里写的效果:

  • Token 消耗减少 40-70%——取决于项目大小
  • 工具调用次数大幅下降——不需要反复 read_file、grep
  • 100% 本地运行——不需要把代码发到任何第三方服务

对于一个日均用 AI 编程工具写几小时代码的开发者来说,token 减少一半意味着什么?意味着你原来一天要花 2 美元,现在只要 1 美元。一年省下来的钱,够买好几把好的机械键盘了。

但数字不是最重要的。真正有意思的是它揭示的一个趋势:

AI 编程工具正在从「聊天」走向「基础设施」

第一波 AI 编程工具(GitHub Copilot 早期版本、ChatGPT 粘贴代码)的逻辑是:你把代码喂给模型,模型给你一个回答。

第二波工具(Claude Code、Cursor Agent 模式)的逻辑是:代理自己在项目里探索、读取、修改。

codegraph 代表的是第三波:代理不应该每次都从零开始探索,它应该有持久的、结构化的项目记忆。

这和我们人类程序员的工作方式其实一样。你接手一个老项目,第一周疯狂读代码,之后你就「记住了」——不是记住每一行,而是记住了结构、关系、模式。下次再改,你直接跳到需要改的地方,不用重新读一遍。

codegraph 就是在给 AI 代理造这个「记忆宫殿」。

实际体验怎么样

我看了项目的 issue 和 commit 记录,几个关键信息:

  • 支持 Claude Code、Codex、Cursor、OpenCode——基本覆盖了主流的 AI 编程工具
  • 安装后通过 .claude/skills.cursor/rules 集成,不需要改工具本身
  • 项目本身用 Claude 辅助开发(commit 记录里有大量 commits by claude),算是自己吃自己的狗粮
  • 最近刚加了 agent-eval 评估框架,说明团队在严肃对待质量

当然也有需要注意的地方:索引大型代码库(比如 Linux 内核级别)的时间和内存消耗还是个问题。项目文档里建议先从你日常工作的中型项目试起。

值不值得用

如果你每天都在用 AI 编程工具,而且项目超过几千行代码,codegraph 几乎是一个免费的性能提升。安装成本低(本地运行,npm install 级别),效果直接(token 省了,速度快了),风险小(不开源代码数据,全在本地)。

如果你只是偶尔用 ChatGPT 改几行小脚本,那暂时没必要。

更大的图景

codegraph 不是唯一在做这件事的团队。类似的思路——给 AI 代理提供结构化的、预计算的知识——正在多个方向冒出来:

  • 有些团队在做文档知识图谱
  • 有些在做 API 调用关系索引
  • 有些在探索代码语义向量化

但 codegraph 是目前最务实的一个:不追求酷炫的 demo,就是老老实实解决「AI 代理读太多文件」这个具体痛点。

有时候,最无聊的问题,解决了就是最大的效率提升。


主要来源: