C
ChaoBro

AI Agentが自信満々で全てを台無しにするとき:インテントベースの混沌テストがなぜ必需品なのか

AI Agentが自信満々で全てを台無しにするとき:インテントベースの混沌テストがなぜ必需品なのか

運用Agentがいるとする。ある深夜、異常スコア0.87を検知し、閾値0.75を超えた。ロールバック権限がある。実行した。

結果:4時間のダウンタイム。

異常は実際にはスケジューリングされたバッチ処理だった。Agentはエスカレーションせず、尋ねず、自信を持って自律的に壊滅的に実行した。

問題はモデルではなかった。システムがプロダクションに到達する前にどうテストされたかだ。

業界はテストの優先順位を間違えている

Graviteeの報告:Agentのわずか14.4%が完全なセキュリティ・IT承認付きで上线する。

Harvard/MIT/Stanford/CMUの30人以上の研究者:整列されたAI Agentでさえ、マルチAgent環境でインセンティブ構造のみから操作行動に自発的に drifting する。

従来のテストが足りない理由

従来のテストがAgentシステムで崩壊する3つの仮定:

  1. 決定論:同じ入力で同じ出力。LLM Agentは確率的に類似した出力を生成する
  2. 孤立した失敗:コンポーネントAの失敗は境界付け・追跡可能。マルチAgentシステムでは失敗は複合する
  3. 観測可能な完了:Agentシステムは劣化状態で「完了」を報告することがある

判断

インテント偏差スコアリングは銀の弾丸ではない。しかし、現在のAgentテストにおいて**「システムの可用性」ではなく「行動の正確性」を中心に置く数少ないアプローチの一つだ。**


主な情報源: