GitHubにGenericAgentというプロジェクトがある。説明は率直だ:「Self-evolving agent: grows skill tree from 3.3K-line seed, achieving full system control with 6x less token consumption。」10,221スター、今日だけで577増加。585回のコミット、最新は1時間前。
数字は置いといて、これが実際に何をするのか。
コアアイデア:エージェントは人間のpromptに依存するべきではない、自分で能力を伸ばすべき
ほとんどのエージェントフレームワークはこう動く:開発者がツールリストを書き、promptテンプレートを定義し、ワークフローを設定して、エージェントがその箱の中で動く。本質的にエージェントの能力上限は開発者が中に詰め込んだもの次第。
GenericAgentは逆だ。3300行のシードコードから始めて、自分でスキルツリーを構築する。ツリーは最初から定義されているわけではない。システムとのインタラクションの過程で成長していく。新しいシナリオに遭遇すると、自分にどんな能力が必要か自分で判断し、対応するスキルノードを生成する。
公式の主張ではトークン消費が6倍削減される。理屈は通っている。従来のやり方では毎回ツールの全説明とコンテキストを載せるが、スキルツリー方式では現在のタスクに関連するスキルブランチだけをロードすればよい。
リポジトリを見る
注目すべき詳細がいくつか:
非常にアクティブ。585回のコミット、1時間前にも更新。オープンイシュー39件、PR20件。コミュニティの参加度は低くない。作者lsdefineのコミットペースはほぼ毎日。
中国コミュニティのDNA。READMEにFeishu表示の処理が含まれている(replace alarming warning with neutral "(无文本输出)" in feishu display)。ドキュメントディレクトリにはWeChatグループのQRコード更新もある。これは海外コミュニティ向け純英語プロジェクトではなく、中国開発者エコシステムに根ざしている。
モジュール構造が明確。リポジトリはmemory、plugins、frontends、reflectのメインディレクトリに分かれている。reflectディレクトリには昨日lightweight goal mode reflect workflowが追加されたばかり。プロジェクトが能力境界を急速にイテレーションしていることがわかる。
6倍のトークン節約はどこから来るのか
この数字には疑問符をつける必要がある。完全なベンチマークレポートは存在しない(少なくともREADMEやissuesでサードパーティの再現結果は見つけられなかった)。しかし設計思想から言えば、トークン節約の論理連鎖は明確だ:
- 従来の方式:Agent呼び出しごとにすべてのツール説明(数十から数百のツール)をロード
- スキルツリー方式:現在のタスクに関連するスキルブランチのみをロード
- 自己進化意味着不要なスキルが刈り込まれ、さらにコンテキストが縮小
このロジックが実際のワークロードで成立すれば、6倍は可能だ。ただし自分のシナリオで走らせてみることを勧める。異なるタスクのスキルツリーブランチ密度は大きく異なる。
試す価値があるか
ある。ただし2つの前提付き:
第一に、シナリオに明確に分離可能な「スキル」があること。エージェントが常に同じことをしているなら、スキルツリーの優位性は大きくない。複数のタスクタイプを切り替える必要がある場合(コードを書く、データベースを照会する、レポートを生成するなど)、スキルツリーのパス選択に意味が出てくる。
第二に、中国語環境への適応にある程度耐えられること。このプロジェクトのドキュメントとコミュニティは主に中国語エコシステムにある。英語優先のサポートが必要な場合は待った方がいいだろう。
一言:自己進化エージェントという方向性は新しいコンセプトではないが、GenericAgentはスキルツリーとトークン効率を結びつけて一貫したストーリーを語っており、コードは実際に動いている。インストールして試してみる損はない。
主な情報源: