用过 Claude Code 或 Codex 的人大概都经历过这个场景:
昨天刚跟 Agent 聊完项目的架构决策、技术选型、编码规范。今天打开新会话,它又是一张白纸,你得从头再解释一遍。
agentmemory 就是冲着这个痛点来的。一周 6,865 星的增长,直接冲到 9,822 总星,320 次 commit,活跃度拉满。
它解决的不是"记忆",是"遗忘"
AI 编程 Agent 的记忆问题分两层:
第一层是会话内记忆。 这个 Claude Code 和 Codex 已经做得不错了——上下文窗口够大,同一会话里的对话都能记住。
第二层是跨会话记忆。 这才是真正的痛点。你换个终端窗口、重启一下 IDE、或者隔了一天再回来,Agent 就把之前学到的项目上下文全忘了。
agentmemory 做的是第二层。它作为一层独立的服务跑在后台,Agent 在会话中产生的关键信息——架构决策、技术约定、踩过的坑——可以被提取并持久化存储。下次新会话启动时,Agent 先从 agentmemory 拉回项目记忆,再接着干活。
不只是 Claude Code,Codex 也支持了
最新的 v0.9.16 版本同时支持 .claude-plugin 和 .codex-plugin 两种插件格式。这意味着不管你用 Claude Code 还是 OpenAI Codex,都能接上同一套记忆层。
项目还支持 Python 示例(examples/python/),说明它不绑定特定 Agent 框架,而是作为一个通用的持久记忆服务存在。
部署比想象中简单
两件事就能跑起来:
# 一行命令部署到 Fly.io / Railway / Render 之一
# 项目提供了三个平台的一键模板(deploy/ 目录)
# 然后在 Claude Code 里装插件
claude plugin install agentmemory
benchmark 目录里有个 load-100k.ts 测试工具,能压测 p50/p90/p99 延迟。说明作者不是随便写个 demo,是认真做了性能验证的。
它不是什么
agentmemory 不是一个 RAG 系统,不是向量数据库,不是知识库。它做的事情更窄、更务实:记录 Agent 在工作过程中的关键决策和上下文,下次需要时能快速检索回来。
这跟 RAG 的区别在于——RAG 是你往库里塞文档然后问问题,agentmemory 是 Agent 自己在工作过程中自动产生的记忆,不需要你手动维护知识库。
一个实际场景
想象你在维护一个微服务项目,有 12 个 service,3 个共享库,一套自定义的 CI/CD 流水线。
没有 agentmemory 的情况下,每次新会话你都要告诉 Agent:
- "这个项目用 Go,但 service-gateway 用 TypeScript"
- "我们的 CI 用的是自定义的 build step,不要改 .github/workflows"
- "上次重构把 auth 模块从 service-a 移到了 shared/auth"
有了 agentmemory,这些在项目开发过程中被 Agent 学到的信息会被持久化。下次你打开新会话,Agent 已经"记得"这些。
值不值得用
实话实说,这个领域的竞争会越来越激烈。Anthropic 自己的 Claude Code 迟早会内建跨会话记忆,OpenAI 的 Codex 也是同理。
但 agentmemory 的优势在于它现在就能用,而且跨 Agent 兼容。如果你同时用 Claude Code 和 Codex,或者你的团队里有人用这个有人用那个,一个统一的记忆层确实有实际价值。
建议:先在一个非关键项目上试两周,看它记的东西准不准、检索回来的上下文有没有用。好用再推广到主力项目。
来源
- rohitg00/agentmemory
- 项目 benchmark 目录的 load-100k.ts 压测工具