如果你用过 Claude Code 或 Cursor 处理一个大型项目,大概率遇到过这样的场景:AI 助手对代码库的某个模块完全陌生,每次对话都要重新解释上下文。Graphify 试图用知识图谱来解决这个结构性问题。
它解决什么问题
Graphify 是一个 Python 项目(MIT 许可证),核心功能是把任意文件夹——代码、文档、论文、甚至图片和视频——自动构建成一个可查询的知识图谱,并以”技能”(skill)形式接入主流 AI 编码助手。
项目由 safishamsi 维护,截至 4 月 29 日已获得 37,989 颗 Star 和 4,199 个 Fork,创建后仅约一周。这个增长速度在开源 AI 工具中相当罕见。
工作原理
Graphify 的架构分两层:
构建层:扫描目标文件夹,用 LLM 提取实体、关系和层次结构,存入图数据库。不同于向量数据库的 chunk-level 检索,知识图谱保留了概念之间的显式连接——函数调用链、文档引用关系、主题关联。
查询层:以 skill 形式注册到 AI 编码助手。支持的平台包括 Claude Code、Codex、Cursor、Gemini CLI、GitHub Copilot CLI、OpenClaw、Factory Droid、Trae、Google Antigravity 等。当 AI 助手需要理解代码库结构时,通过图谱查询获取结构化的上下文,而不是依赖单纯的文本相似度匹配。
与传统 RAG 的区别
| 维度 | 向量检索 RAG | Graphify 知识图谱 |
|---|---|---|
| 检索单位 | 文本片段(chunk) | 实体+关系 |
| 多跳查询 | 困难,需要多次检索 | 天然支持 |
| 结构感知 | 无,丢失代码层次 | 保留函数/模块/文档层级 |
| 适用场景 | 单一事实查询 | 跨文档/跨模块的综合分析 |
FalkorDB 最近的 GraphRAG-Bench 测试也验证了这一趋势:图结构 RAG 在多跳推理任务上的准确率显著高于传统向量检索。Graphify 的实践方向与评测结果一致。
快速上手
# 克隆项目
git clone https://github.com/safishamsi/graphify.git
cd graphify
# 安装依赖
pip install -r requirements.txt
# 构建知识图谱
python graphify.py --input /path/to/your/project
# 作为 skill 接入 Claude Code
# 在 Claude Code 中启用 Graphify skill
项目最近更新频繁(4 月 29 日仍有 push),社区活跃度高。MIT 许可证允许商业使用。
观察点
- 图谱构建的准确度和速度在超大型代码库(百万行级)上的表现尚待验证
- 目前主要依赖 LLM 提取实体关系,成本和质量受底层模型影响
- 与 GraphRAG SDK、Neo4j 等方案的对比评测尚未出现
对于经常需要让 AI 助手理解复杂代码库的开发者来说,这是一个值得立即试用的工具。如果你的项目有超过 50 个模块或大量交叉引用的文档,知识图谱方式可能带来明显的上下文质量提升。