AIエージェントの「文脈健忘」困境：AGENTS.mdでは百万トークンのドメイン知識を保持できない

核心的結論

AIコーディングツールの分野は微妙な転換点を経験している。すべての製品がモデルの知能を競争しているとき、開発者コミュニティではまったく異なる不満が広がり始めている：

基本的な生産性は満たされた今、人を崩壊させる根本原因はモデルが愚かなのではなく、セッションを開くたびに記憶喪失になることだ。

この一文は、2026年のAIエージェント実用化が直面する最も核心的なボトルネックを突いている。

AGENTS.md、CLAUDE.md、.github/copilot-instructions——これらはエージェントがドメイン知識を取得する主要なチャネルだ。しかし、それらの容量には限りがある。

数十万行のコード、数十のマイクロサービス、複雑なビジネスロジック、技術的負債の歴史をメンテナンスしているとき……これらの知識の総量は百万トークンを超える可能性がある。どんな設定ファイルもこれほど多くのものを詰め込むことはできない。

RAGは確かにエージェントが既存のドキュメントを検索するのを助ける。しかし、致命的な盲点がある：

RAGは「未知の未知（unknown unknowns）」を検索できない。

新人が入社して2週間のペアプログラミングで内在化するドメイン知識は、ドキュメントに書かれたルールだけではない。書き記されていない経験的判断も含まれる：

これらの暗黙的知識に対して、RAGは無力だ。

知識注入の問題を解決するために、開発者は手動でSkillsファイルをメンテナンスし始めた。しかし結果は：

Skillsのメンテナンスに吐き気がする。

コードは変わり、ビジネスは変わり、アーキテクチャは変わる。毎回の変化はSkillsファイルの同期更新を必要とし、これは重いメンテナンス作業になってしまう。

会社で、新人は2週間のペアプログラミングでドメイン知識を内在化できる。このプロセスにはいくつかの重要な特徴がある：

現在のAIエージェントシステムでこのプロセスを真にシミュレーションできるものはほとんどない。

すべての知識を一度に注入しようとするのではなく、エージェントがプロジェクトのインタラクションを通じて徐々にドメイン理解を構築できるようにする。Hermes AgentのMemory Wiki、OpenClawのFollow-up Commitmentsメカニズムはこの方向を探求している。

エージェントが自分の推論過程、失敗経験、修正パスを自動的に記録し、後続のセッションでこれらの記録を参照できれば、「デジタル徒弟」の学習モードを形成できる。

プロジェクトのアーキテクチャ決定、依存関係、ビジネスルールを照会可能な知識グラフとして整理することは、純テキストのAGENTS.mdよりも柔軟でメンテナンスしやすい。

すべての知識を1つのファイルに詰め込もうとしない：階層管理——核心ルールはAGENTS.mdに、プロジェクトレベルの文脈はRAGに、歴史決定記録は知識グラフに
エージェントにCode Reviewに参加させる：PRディスカッションとコード変更を読むことで、エージェントはプロジェクトの暗黙的知識を自動的に学習できる
セッション永続化を活用する：Hermes AgentのProfiles機能は、異なるプロジェクトのために独立した文脈状態を保存でき、毎回ゼロから始めることを避ける

文脈永続化は贅沢品ではなく、AIエージェントが玩具からツールになるための唯一の道だ。この問題を最初に解決した者が、エージェントインフラ競争で先機を占めることができる。