今のAIエージェントにはすごく馬鹿げた問題がある。
30分かけてエージェントと会話し、好みやプロジェクト構造、コードスタイルを教える。そして新しいセッションを開く——エージェントはすべてを忘れる。
毎回が初対面だ。
4層メモリ構造
これを解決しようとする試みがあり、人間の記憶の階層化を模倣するアプローチだ:
L1 作業メモリ(<5ms):短期記憶に相当。現在のタスクに必要な情報をリアルタイムで読み書き、極めて高速。「ユーザーが今どのファイルを編集しているか」のようなもの。
L2 エピソードメモリ(イベントグラフ):起きたことを記録する。生ログではなく構造化されたイベントグラフ——「ユーザー昨日認証モジュールを修正した、トークン有効期限バグを見つけたので」。
L3 意味メモリ(圧縮HNSW):経験を検索可能な知識に圧縮する。「常識」のようなもの——いつ何があったか正確に覚える必要はないが、「このプロジェクトの認証はJWTを使う」ことは知っている。
L4 クラウドアーカイブ + ID永続化:長期保存。日記帳のようなもの——めったに開かないが、必要な時に調べられる。
核心的な課題は保存ではなく適応的検索だ。エージェントはL1からL4の間で「この情報をどこで探すか」を自動で判断する必要がある。毎回手動で指定するのではない。
→ 関連記事:エージェント永続メモリツール | エージェントコンテキスト永続化
主要ソース: