C
ChaoBro

给 AI 编程 Agent 装上长期记忆:agentmemory 为什么一周涨了 6800 星

给 AI 编程 Agent 装上长期记忆:agentmemory 为什么一周涨了 6800 星

用过 Claude Code 或 Codex 的人大概都经历过这个场景:

昨天刚跟 Agent 聊完项目的架构决策、技术选型、编码规范。今天打开新会话,它又是一张白纸,你得从头再解释一遍。

agentmemory 就是冲着这个痛点来的。一周 6,865 星的增长,直接冲到 9,822 总星,320 次 commit,活跃度拉满。

它解决的不是"记忆",是"遗忘"

AI 编程 Agent 的记忆问题分两层:

第一层是会话内记忆。 这个 Claude Code 和 Codex 已经做得不错了——上下文窗口够大,同一会话里的对话都能记住。

第二层是跨会话记忆。 这才是真正的痛点。你换个终端窗口、重启一下 IDE、或者隔了一天再回来,Agent 就把之前学到的项目上下文全忘了。

agentmemory 做的是第二层。它作为一层独立的服务跑在后台,Agent 在会话中产生的关键信息——架构决策、技术约定、踩过的坑——可以被提取并持久化存储。下次新会话启动时,Agent 先从 agentmemory 拉回项目记忆,再接着干活。

不只是 Claude Code,Codex 也支持了

最新的 v0.9.16 版本同时支持 .claude-plugin.codex-plugin 两种插件格式。这意味着不管你用 Claude Code 还是 OpenAI Codex,都能接上同一套记忆层。

项目还支持 Python 示例(examples/python/),说明它不绑定特定 Agent 框架,而是作为一个通用的持久记忆服务存在。

部署比想象中简单

两件事就能跑起来:

# 一行命令部署到 Fly.io / Railway / Render 之一
# 项目提供了三个平台的一键模板(deploy/ 目录)

# 然后在 Claude Code 里装插件
claude plugin install agentmemory

benchmark 目录里有个 load-100k.ts 测试工具,能压测 p50/p90/p99 延迟。说明作者不是随便写个 demo,是认真做了性能验证的。

它不是什么

agentmemory 不是一个 RAG 系统,不是向量数据库,不是知识库。它做的事情更窄、更务实:记录 Agent 在工作过程中的关键决策和上下文,下次需要时能快速检索回来。

这跟 RAG 的区别在于——RAG 是你往库里塞文档然后问问题,agentmemory 是 Agent 自己在工作过程中自动产生的记忆,不需要你手动维护知识库。

一个实际场景

想象你在维护一个微服务项目,有 12 个 service,3 个共享库,一套自定义的 CI/CD 流水线。

没有 agentmemory 的情况下,每次新会话你都要告诉 Agent:

  • "这个项目用 Go,但 service-gateway 用 TypeScript"
  • "我们的 CI 用的是自定义的 build step,不要改 .github/workflows"
  • "上次重构把 auth 模块从 service-a 移到了 shared/auth"

有了 agentmemory,这些在项目开发过程中被 Agent 学到的信息会被持久化。下次你打开新会话,Agent 已经"记得"这些。

值不值得用

实话实说,这个领域的竞争会越来越激烈。Anthropic 自己的 Claude Code 迟早会内建跨会话记忆,OpenAI 的 Codex 也是同理。

但 agentmemory 的优势在于它现在就能用,而且跨 Agent 兼容。如果你同时用 Claude Code 和 Codex,或者你的团队里有人用这个有人用那个,一个统一的记忆层确实有实际价值。

建议:先在一个非关键项目上试两周,看它记的东西准不准、检索回来的上下文有没有用。好用再推广到主力项目。

来源