Claude CodeやCodexを使ったことのある人なら、こんな状況を経験したことがあるでしょう:
昨日、Agentとプロジェクトのアーキテクチャ意思決定、技術選定、コーディング規約について議論を終えたばかり。ところが今日、新しいセッションを開くと、Agentはまるで真っ白な状態で、あなたはまた最初からすべてを説明しなければなりません。
agentmemory は、まさにこの課題を解決するために登場しました。1週間で6,865スターの増加を記録し、総スター数は9,822に達。320回のコミットを重ね、活発な開発が続いています。
解決しようとしているのは「記憶」ではなく、「忘却」
AIプログラミングAgentの記憶に関する課題には、2つのレイヤーがあります:
第1レイヤー:セッション内記憶。
これはClaude CodeやCodexがすでに十分に実現しています——コンテキストウィンドウが広く、同一セッション内の会話内容はすべて記憶されます。
第2レイヤー:セッション横断記憶。
これが真の課題です。ターミナルのウィンドウを切り替えたり、IDEを再起動したり、あるいは1日空けて戻ってきたとき、Agentはこれまでに学んだプロジェクトの文脈をすべて忘れてしまいます。
agentmemoryが対象とするのは、まさにこの第2レイヤーです。agentmemoryはバックグラウンドで独立したサービスとして動作し、Agentのセッション中に生成された重要な情報——アーキテクチャ上の意思決定、技術的な約束事、遭遇した障害など——を抽出して永続的に保存します。次回の新規セッション開始時には、Agentがまずagentmemoryからプロジェクトの記憶を取得し、その後作業を再開します。
Claude Codeだけではなく、Codexもサポート
最新のv0.9.16バージョンでは、.claude-pluginおよび.codex-pluginの両方のプラグインフォーマットを同時にサポートしています。つまり、Claude Codeを使ってもOpenAI Codexを使っても、同じ記憶層に接続できます。
さらに、プロジェクトにはPython用のサンプル(examples/python/)も含まれており、特定のAgentフレームワークに依存しない、汎用的な永続記憶サービスとして設計されていることがわかります。
導入は想像以上に簡単
たった2ステップで動作開始できます:
# Fly.io / Railway / Render のいずれかへの1行コマンドデプロイ
# プロジェクトには、各プラットフォーム向けのワンクリックテンプレート(deploy/ ディレクトリ内)が用意されています
# その後、Claude Codeでプラグインをインストール
claude plugin install agentmemory
benchmarkディレクトリには、load-100k.tsというテストツールがあり、p50/p90/p99の遅延を負荷試験できます。これは著者が単なるデモではなく、真剣にパフォーマンス検証を行っていることを示しています。
これは何ではないか
agentmemoryはRAG(Retrieval-Augmented Generation)システムでもなければ、ベクトルデータベースでも、知識ベースでもありません。その役割はより狭く、より実践的です:Agentが作業中に下す重要な意思決定や文脈を記録し、次回必要なときに素早く検索できるようにすることです。
これはRAGとの根本的な違いがあります——RAGでは、ユーザーがドキュメントを知識ベースに手動で投入してから質問しますが、agentmemoryでは、Agent自身が作業中に自動的に記憶を生成するため、知識ベースの手動メンテナンスは不要です。
実際の利用シーン
マイクロサービスプロジェクトをメンテナンスしていると仮定してください。このプロジェクトには12のサービス、3つの共有ライブラリ、そしてカスタムのCI/CDパイプラインが存在します。
agentmemoryがない場合、毎回新しいセッションを開始するたびに、Agentに対して以下のような説明を繰り返す必要があります:
- 「このプロジェクトはGoで構築されていますが、service-gatewayはTypeScriptで実装されています」
- 「CIはカスタムのビルドステップを使用しており、
.github/workflowsを変更しないでください」 - 「先日のリファクタリングで、authモジュールはservice-aからshared/authへ移動しました」
agentmemoryがあれば、こうしたプロジェクト開発中にAgentが学習した情報が永続化されます。次回新しいセッションを開いたとき、Agentはすでにこれらを「覚えている」のです。
導入する価値はあるか?
正直に言うと、この分野の競争は今後ますます激化していくでしょう。Anthropic社のClaude Codeも、やがてセッション横断記憶機能を内蔵するようになるでしょうし、OpenAIのCodexも同様です。
しかしagentmemoryの強みは、「今すぐ使える」点と、「複数のAgent間での互換性」にあります。もしClaude CodeとCodexの両方を使っている、あるいはチーム内でそれぞれ異なるAgentを使っている場合、統一された記憶層は実際に大きな価値を生み出します。
ご提案:まずは本番環境で使わない非重要プロジェクトで2週間ほど試してみてください。記憶される内容の正確性や、検索された文脈の実用性を確認しましょう。十分に有用だと感じたら、本格的なプロジェクトへの展開を検討してください。
出典
- rohitg00/agentmemory
- プロジェクトのbenchmarkディレクトリにある
load-100k.ts負荷試験ツール