AnthropicがAIエージェント同士の売買実験で格差リスクを発見

実験の概要と成果

社員69人参加の模擬マーケット
186件・総額4000ドル超の実取引成立
予算100ドルのギフトカード決済

浮かび上がった課題

高性能モデル利用者が有利な結果に
不利な側が格差に気づかない問題
初期指示が価格・成約率に影響せず
エージェント品質格差」の懸念
詳細を読む

Anthropicは、AIエージェントが売り手と買い手の双方を代理して実際の商品を売買する実験「Project Deal」の結果を公表しました。社員69人が参加し、各自100ドルの予算を使って同僚の出品物を購入するクラシファイド型マーケットプレイスで、合計186件・総額4,000ドル超の取引が成立しています。

実験では4つの異なるマーケットプレイスが用意されました。1つは全参加者が同社の最先端モデルに代理され、取引結果が実際に履行される「本番」環境です。残り3つは比較研究用で、モデルの性能差が取引結果に与える影響を検証する設計でした。Anthropicは「Project Dealが驚くほどうまく機能した」と述べています。

注目すべき発見は、より高性能なモデルを使うユーザーが「客観的に良い結果」を得た一方、不利な結果を受けたユーザーがその格差に気づかなかった点です。Anthropicはこれをエージェント品質格差」と呼び、AIエージェントが経済活動を代行する将来において、性能差が見えない形で不平等を生む可能性を指摘しました。

もう一つの興味深い結果として、エージェントに与えた初期指示は成約率や交渉価格にほとんど影響しなかったことがわかりました。これはモデル自体の交渉能力が指示内容より重要であることを示唆しています。エージェント間取引が本格化する前に、品質の透明性確保が重要な課題となりそうです。