C
ChaoBro

「Your Agent, Their Asset」:14人のセキュリティ研究者がAIエージェントにポイズニング攻撃、12種類のハイジャック経路を記録

「Your Agent, Their Asset」:14人のセキュリティ研究者がAIエージェントにポイズニング攻撃、12種類のハイジャック経路を記録

何があったのか

2026年4月、「Your Agent, Their Asset」というタイトルのセキュリティ論文が学界とAIエンジニアコミュニティの両方で注目を集めた。UC Santa Cruz、バークレー、騰訊セキュリティラボ、ByteDanceセキュリティチームの14人の研究者が、現在最も広く導入されている個人用AIエージェントに対する体系的なペネトレーションテストを実施し、完全な制御権を獲得することに成功し、12種類の異なるポイズニング攻撃経路を記録した。

これは理論的な推測ではない——研究者たちは実際に攻撃を実行し、すべての経路の実行可能性を検証した。

ClawHub悪意スキル事件より深刻な理由

5月初旬のClawHub悪意スキル事件を覚えているかもしれない:セキュリティ研究者Aks SharmaがClawHub上で30の悪意あるスキルを発見、1万回以上ダウンロードされ、AIエージェントを暗号通貨マイニングのボットネット化した。

「Your Agent, Their Asset」論文が明らかにした問題はより根本的で体系的である:

次元 ClawHub事件(2026.05) 「Your Agent, Their Asset」論文
攻撃面 スキルマーケット(単一入口) エージェントの全ライフサイクル(12経路)
攻撃の複雑さ 低(悪意スキルを公開するだけ) 中〜高(一部の経路にはソーシャルエンジニアリングが必要)
影響範囲 ClawHubプラットフォームユーザー ターゲットエージェントの全ユーザー
検出可能性 中(スキルコードは監査可能) 極めて低い(一部のポイズニングは訓練データに埋め込み)
修正の難しさ 悪意スキルを下架 エージェント信頼モデルの再構築が必要

12種類の攻撃経路の分類

研究者たちは12の攻撃経路を3つのカテゴリに分類した:

🔴 データ層ポイズニング(4種類)

  1. 訓練データ注入:エージェントの事前学習/ファインチューニングデータセットに悪意のあるパターンを注入
  2. RAGナレッジベース汚染:エージェントの検索ナレッジベースに誤解を招くドキュメントを注入
  3. メモリストレージ改ざん:エージェントの永続化メモリを変更し、行動ベースラインを変化させる
  4. コンテキストウィンドウハイジャック:ユーザーの会話に巧妙に構成されたプロンプトを注入し、システム指示を上書き

🟡 ツール層ハイジャック(4種類)

  1. MCPサーバー中間者攻撃:エージェントと外部ツール間の通信を傍受、入出力を改ざん
  2. スキル依存チェーン攻撃:サードパーティスキルの依存関係を通じて悪意コードを伝播
  3. APIキー漏洩悪用:エージェントが保存したAPIキーを使用して外部サービスにアクセス
  4. ファイルシステム権限昇格:エージェントのファイル操作権限を通じてシステムレベルのアクセスを取得

🟠 エージェント間伝播(4種類)

  1. マルチエージェント通信感染:感染したエージェントがメッセージ配信を通じて他のエージェントを感染させる
  2. 共有ワークスペース汚染:エージェントが共有するワークスペースを通じて悪意指示を伝播
  3. ツール呼び出しチェーンハイジャック:エージェントAのツール呼び出し出力がエージェントBによって信頼できる入力として扱われる
  4. クロステーナントデータ漏洩:マルチテナント環境で、あるユーザーのエージェントが別のユーザーのデータにアクセス

研究チームが行ったこと

研究者たちは大胆だが責任あるアプローチを取った:

  1. 完全アクセスの取得:まずターゲットエージェントの完全なアクセス権を取得(法的チャネルまたはユーザー認可による)
  2. ポイズニング攻撃の実行:12の攻撃経路の実行可能性を一つずつ検証
  3. 影響範囲の記録:各攻撃が引き起こす可能性のあるデータ漏洩、金銭的損失、システム破壊を定量化
  4. 責任ある開示:論文発表前に関連ベンダーに脆弱性レポートを提出

重要な発見は、大部分の攻撃経路にはコードの脆弱性悪用が不要ということだ。攻撃者はエージェントの信頼モデルを理解するだけで、「正当な」インターフェースを通じて悪意ある目的を達成できる。

業界への影響

この論文が発表されたタイミングは極めて重要である:

  • CISAおよびファイブアイズが5月初旬に「Agentic AIセキュリティガイド」を発表
  • マイクロソフトの研究チームが同時にマルチエージェントネットワークにおける交差感染問題を報告——単一の悪意あるメッセージがエージェントネットワークを飛び越えて伝播し、徐々にプライベートデータを抽出
  • Google DeepMindもAIエージェントのハイジャック攻撃6種類を記録したフレームワークを発表

これはAIエージェントのセキュリティが「学術的関心」から「産業優先事項」に移行しつつあることを意味する。学術セキュリティチーム、テックジャイアント、政府セキュリティ機関が同時に警告を発するとき、これはノイズではなくシグナルである。

アクションアイテム

短期(今週)

  • AIエージェントにインストールされているスキル/プラグインを確認、不要なものを削除
  • エージェントが使用するAPIキーの権限を確認、最小必要権限にダウングレード

中期(今月)

  • チーム内でAIエージェントのセキュリティ審査プロセスを確立
  • 本番環境のエージェントに監査ログと異常検知を導入

長期(今四半期)

  • エージェントセキュリティスキャンツールの導入を評価
  • マルチエージェントシステム設計にゼロトラストアーキテクチャの採用を検討

AIエージェントの能力が強いほど、ハイジャックされた後の破壊力も大きくなる。この論文は人々を怖がらせるためのものではない——セキュリティは事後に補うのではなく、アーキテクチャ設計の第一天から考慮しなければならないことを教えているのである。