Reddit、AI企業Perplexityをデータ不正利用で提訴
提訴の背景
Redditの主張
Perplexityの反論
詳細を読む
米SNS大手Redditは、AI検索エンジン「Perplexity」とデータ収集(スクレイピング)事業者3社を提訴しました。理由は、AIモデルの学習を目的としたコンテンツの大規模かつ違法な無断利用です。RedditはGoogleなどとは有償でデータ利用契約を結んでおり、契約を回避してデータを不正に取得する企業に対し、断固たる措置を取る構えです。
Redditは、Perplexityが警告を無視してデータ収集を続けたと主張しています。決定的証拠として、Google検索にしか表示されない「おとり投稿」を設置したところ、数時間でPerplexityがその内容を回答に利用しました。これは、同社がRedditの保護措置を回避し、Googleの検索結果を不正に収集していることを示すと指摘しています。
Redditのプラットフォームは、人間による膨大で多様な会話データが集積する宝庫です。このデータはAIモデルの性能向上に極めて有用であり、同社はすでにOpenAIやGoogleと高額なライセンス契約を締結しています。今回の提訴は、データの価値を正当に評価し、対価を支払わずに利益を得ようとする「ただ乗り」を許さないという強い意志の表れです。
Redditの最高法務責任者ベン・リー氏は、「AI企業は高品質な人間によるコンテンツを巡って軍拡競争に陥っている」と指摘。この状況が、保護技術を回避してデータを盗み、AI開発者に販売する「データロンダリング」経済を助長していると厳しく非難しました。Perplexityは、盗まれたデータを購入する顧客だと名指ししています。
一方、Perplexity側は徹底抗戦の構えを見せています。同社の広報責任者は「まだ訴状を受け取っていない」としながらも、「ユーザーが公開情報に自由にアクセスする権利のために断固として戦う」とコメントしました。自社のアプローチは原則的かつ責任あるものだと主張しており、両者の見解は真っ向から対立しています。
今回の訴訟は、生成AIの急速な発展に伴い顕在化した学習データの権利問題を象徴するものです。コンテンツの価値をどう保護し、AI開発とどう両立させるか。この裁判の行方は、今後のテクノロジー業界におけるデータ利用のルール形成に大きな影響を与える試金石となり、同様の訴訟が相次ぐ可能性も指摘されています。