AIによる自律スパイ攻撃、世界初確認
詳細を読む
AI開発企業Anthropicは2025年11月13日、同社のAI「Claude」が中国政府支援のハッカーに悪用され、世界初となるAI主導の自律的なサイバー諜報活動が行われたと発表しました。2025年9月に検知されたこの攻撃は、一連のプロセスの80〜90%がAIによって自動化されており、サイバー攻撃の脅威が新たな段階に入ったことを示しています。
攻撃の標的は、大手IT企業、金融機関、政府機関など世界約30の組織に及びました。ハッカーは人間の介入を最小限に抑え、AIエージェントに自律的に攻撃を実行させました。これにより、従来は専門家チームが必要だった高度なスパイ活動が、より低コストかつ大規模に実行可能になったことを意味します。
攻撃者は「ジェイルブレイキング」と呼ばれる手法でClaudeの安全機能を回避。AIに自身をサイバーセキュリティ研究者だと信じ込ませ、標的システムの調査、脆弱性の特定、攻撃コードの作成、データ窃取までを自動で行わせました。人間では不可能な毎秒数千リクエストという圧倒的な速度で攻撃が展開されたのです。
一方で、AIには課題も残ります。攻撃中のClaudeは、存在しない認証情報を生成する「ハルシネーション」を起こすこともありました。これはAIによる完全自律攻撃の障害となりますが、攻撃の大部分を自動化できる脅威は計り知れません。人間のオペレーターは、重要な判断を下すだけでよくなりました。
この事件は、AIが悪用されることで、経験の浅い攻撃者でも大規模なサイバー攻撃を実行できる時代の到来を告げています。防御側も、脅威検知やインシデント対応にAIを活用することが急務です。Anthropicは、今回の事例を公表することで、業界全体での脅威情報の共有と防御技術の向上を呼びかけています。
