C
ChaoBro

Anthropic社内実験:69体のClaude AgentがSlackで中古品取引、186件成立

Anthropic社内実験:69体のClaude AgentがSlackで中古品取引、186件成立

売り手も買い手もAIな社内の「フリマアプリ」

Anthropicはある種不思議な実験をひっそりと完了させた。

69名の従業員にそれぞれClaude搭載のAgentを割り当て、Slack上に構築されたプライベート中古品市場で、Agentが従業員に代わって個人所有品を売買させた。スキー板、ピンポン球の袋、いろいろな雑貨。1週間ずっと、人間の介入なしに。

結果:186件成立、合計4000ドル以上。

名前もストレートだ:Project Deal。

直感に反する発見

この実験で最も興味深いのは「AIが取引できる」ことではない。技術的にそれは難しくない。本当に興味深いのは実験中发现されたパターンだ:

Opusユーザーはより良い取引を獲得したが、Haikuユーザーは自分が損をしていることに全く気づかなかった。

つまり、片方がより強力なモデル(Opus)、もう片方が weaker なモデル(Haiku)を使っている場合、OpusのAgentは交渉でより有利な価格を獲得できた。そしてHaikuのAgentは自分が押さえ込まれていることに気づかなかったのだ。

これはバグではない。シグナルだ。

Agent-to-Agentの経済的インタラクションにおいて、モデル能力の差は直接的に「商業的優位性」に変換される。より大きなシナリオに置けば、将来的にあなたのAgentがECプラットフォームで売り手のAgentと値切り交渉をするとき、あなたが使うモデルのバージョンがどれくらいのお金を節約できるかを左右するかもしれない。

これは製品発表ではなく研究だ

Anthropicはこの実験を研究プロジェクトとして位置づけた。製品プレビューとしてではない。彼らが关注した核心的な質問はこうだ。「AI Agentが買い手と売り手の両方を代表する市場まで、あとどのくらいか?」

答えは多くの人が考えるよりも近いかもしれない。

この実験は管理された条件下で行われた:Slackプライベート市場、本物の品物だが金額は小さい、Anthropicの従業員が人間の依頼者。しかし重要な仮説を検証した。Agentは完全な取引チェーンを独立して完了できるのだ。商品の発見、価値の評価、対話の開始、値切り交渉、取引成立。

その間に人間がUIに触れることは一度もなかった。

Managed Agentsとの関係

同日、AnthropicはManaged Agents(托管Agent)機能もリリースした。3点セット:

  • Dreaming:Agentが夜間に1日の作業をリプレイし、自己最適化する
  • Outcomes:目標だけ briefing すれば、手順は任せる
  • Multi-Agent Orchestration:1体のClaudeが専門Claudeの艦隊を指揮

Project DealとManaged Agentsを合わせて見ると、シグナルはより明確になる。AnthropicはAgentを「ツール」から「代理人」に押し進めている。前者は言われたことをやるだけ。後者は世界とのやり取りであなたを代表する。

フリマ実験はこの代理関係を具体化しただけだ。あなたのAgentがあなたに代わって交渉し、あなたは部屋にいない。

現実的な問題

Agentがあなたの代わりにものを買うとき、その交渉戦略をどこまで信頼すべきか?

実験ではHaikuユーザーが損をしたことに気づかなかった。これは「Agent能力差→実際の利益損失」という連鎖が真实に存在し、ユーザーはそれに気づかない可能性すらあることを示している。

将来的に、どのモデルでショッピングAgentを走らせるかは、あなたが想像するより重要かもしれない。

次のステップ

Anthropicはこの種の実験を続けると言っている。次の方向性はより複雑なマルチAgentシナリオになる可能性がある。複数のAgentが1つのプロジェクトで協力したり、Agent間により長期的な取引関係が形成されたり。

186件、4000ドル。規模は小さい。だが方向感は明確だ。

主要ソース:Anthropic智东西