Reddit、AI企業Perplexityをデータ不正利用で提訴

規制・法務市場動向データ・プライバシー

提訴の背景

AI学習用のデータ無断利用
AI検索Perplexity社を提訴
Google等とは有償ライセンス契約
契約なき「ただ乗り」を阻止

Redditの主張

保護措置を回避しデータを窃取
Google検索結果を不正に収集
「データロンダリング」と批判

Perplexityの反論

公開情報へのアクセス権を主張
訴状受領前だが徹底抗戦の構え
@stutimesのXポスト: レディット $RDDT が、同社サイトのデータを許可なくスクレイピング(自動収集)したとして、「Perplexity AI」とその他3社を提訴。 訴状によると、Oxylabs UAB、AWMProxy、SerpApi の3社はGoogle経由でレディットのデータを収集・再販して…
詳細を読む

米SNS大手Redditは、AI検索エンジン「Perplexity」とデータ収集(スクレイピング)事業者3社を提訴しました。理由は、AIモデルの学習を目的としたコンテンツの大規模かつ違法な無断利用です。RedditはGoogleなどとは有償でデータ利用契約を結んでおり、契約を回避してデータを不正に取得する企業に対し、断固たる措置を取る構えです。

Redditは、Perplexityが警告を無視してデータ収集を続けたと主張しています。決定的証拠として、Google検索にしか表示されない「おとり投稿」を設置したところ、数時間でPerplexityがその内容を回答に利用しました。これは、同社がRedditの保護措置を回避し、Googleの検索結果を不正に収集していることを示すと指摘しています。

Redditのプラットフォームは、人間による膨大で多様な会話データが集積する宝庫です。このデータはAIモデルの性能向上に極めて有用であり、同社はすでにOpenAIやGoogleと高額なライセンス契約を締結しています。今回の提訴は、データの価値を正当に評価し、対価を支払わずに利益を得ようとする「ただ乗り」を許さないという強い意志の表れです。

Redditの最高法務責任者ベン・リー氏は、「AI企業は高品質な人間によるコンテンツを巡って軍拡競争に陥っている」と指摘。この状況が、保護技術を回避してデータを盗み、AI開発者に販売する「データロンダリング」経済を助長していると厳しく非難しました。Perplexityは、盗まれたデータを購入する顧客だと名指ししています。

一方、Perplexity側は徹底抗戦の構えを見せています。同社の広報責任者は「まだ訴状を受け取っていない」としながらも、「ユーザーが公開情報に自由にアクセスする権利のために断固として戦う」とコメントしました。自社のアプローチは原則的かつ責任あるものだと主張しており、両者の見解は真っ向から対立しています。

今回の訴訟は、生成AIの急速な発展に伴い顕在化した学習データの権利問題を象徴するものです。コンテンツの価値をどう保護し、AI開発とどう両立させるか。この裁判の行方は、今後のテクノロジー業界におけるデータ利用のルール形成に大きな影響を与える試金石となり、同様の訴訟が相次ぐ可能性も指摘されています。