每次用 Claude Code、Cursor 或 Codex 处理一个大项目,你都能感受到那种「慢性烧钱」的痛:代理要理解项目结构,先得逐个文件读取;要定位某个函数的调用关系,得翻遍十几个文件;改一行代码,它可能读了 20 个文件才敢下手。
这就是 codegraph 想解决的问题——不是让模型更聪明,而是让它不用读那么多东西。
知识图谱的思路,用在代码上
codegraph 的核心想法其实不复杂:与其让 AI 代理每次进来都重新读一遍代码,不如事先把代码库的关系结构提取出来,建成一个图数据库。
这个图里存的是什么?函数之间的调用关系、类的继承链、模块间的依赖——说白了就是你在 IDE 里按 Cmd+Click 跳转时看到的那些东西,只不过被结构化、索引化了。
当 AI 代理需要理解某个函数时,它不用再去 grep、不用再去读整个文件,直接查询图谱:谁调了我、我调了谁、我的入参来自哪里。几毫秒,完事。
数字很直观
项目 README 里写的效果:
- Token 消耗减少 40-70%——取决于项目大小
- 工具调用次数大幅下降——不需要反复 read_file、grep
- 100% 本地运行——不需要把代码发到任何第三方服务
对于一个日均用 AI 编程工具写几小时代码的开发者来说,token 减少一半意味着什么?意味着你原来一天要花 2 美元,现在只要 1 美元。一年省下来的钱,够买好几把好的机械键盘了。
但数字不是最重要的。真正有意思的是它揭示的一个趋势:
AI 编程工具正在从「聊天」走向「基础设施」
第一波 AI 编程工具(GitHub Copilot 早期版本、ChatGPT 粘贴代码)的逻辑是:你把代码喂给模型,模型给你一个回答。
第二波工具(Claude Code、Cursor Agent 模式)的逻辑是:代理自己在项目里探索、读取、修改。
codegraph 代表的是第三波:代理不应该每次都从零开始探索,它应该有持久的、结构化的项目记忆。
这和我们人类程序员的工作方式其实一样。你接手一个老项目,第一周疯狂读代码,之后你就「记住了」——不是记住每一行,而是记住了结构、关系、模式。下次再改,你直接跳到需要改的地方,不用重新读一遍。
codegraph 就是在给 AI 代理造这个「记忆宫殿」。
实际体验怎么样
我看了项目的 issue 和 commit 记录,几个关键信息:
- 支持 Claude Code、Codex、Cursor、OpenCode——基本覆盖了主流的 AI 编程工具
- 安装后通过
.claude/skills或.cursor/rules集成,不需要改工具本身 - 项目本身用 Claude 辅助开发(commit 记录里有大量
commits by claude),算是自己吃自己的狗粮 - 最近刚加了 agent-eval 评估框架,说明团队在严肃对待质量
当然也有需要注意的地方:索引大型代码库(比如 Linux 内核级别)的时间和内存消耗还是个问题。项目文档里建议先从你日常工作的中型项目试起。
值不值得用
如果你每天都在用 AI 编程工具,而且项目超过几千行代码,codegraph 几乎是一个免费的性能提升。安装成本低(本地运行,npm install 级别),效果直接(token 省了,速度快了),风险小(不开源代码数据,全在本地)。
如果你只是偶尔用 ChatGPT 改几行小脚本,那暂时没必要。
更大的图景
codegraph 不是唯一在做这件事的团队。类似的思路——给 AI 代理提供结构化的、预计算的知识——正在多个方向冒出来:
- 有些团队在做文档知识图谱
- 有些在做 API 调用关系索引
- 有些在探索代码语义向量化
但 codegraph 是目前最务实的一个:不追求酷炫的 demo,就是老老实实解决「AI 代理读太多文件」这个具体痛点。
有时候,最无聊的问题,解决了就是最大的效率提升。
主要来源: