Anthropicの「AI攻撃90%自律」主張に専門家が疑問
出典:Ars Technica
詳細を読む
AI企業のAnthropicが、中国の国家支援ハッカーが同社のAI「Claude」を悪用し、作業の90%を自律化させたサイバー諜報活動を観測したと発表しました。しかし、この「前例のない」AIの悪用事例に対し、外部のサイバーセキュリティ専門家からはその信憑性を問う声が上がっており、議論を呼んでいます。
Anthropicの報告によると、この高度な諜報活動では、AIが人間の介入をほとんど必要とせず、キャンペーンごとに4〜6回の重要な意思決定のみでタスクを遂行したとされています。同社は、AIエージェントが悪用されることで、大規模サイバー攻撃の脅威が格段に増すと警鐘を鳴らしています。
一方で、外部の研究者はこの発表に懐疑的です。Phobos Groupの創設者ダン・テントラー氏は、「なぜ攻撃者だけが、他の誰もできないようなことをAIモデルにやらせられるのか」と指摘。善意のハッカーや開発者がAI活用で漸進的な成果しか得られていない現状との矛盾を問題視しています。
専門家が疑問視するのは、AIモデルが攻撃者の意図には忠実に応える一方で、一般的な開発者には期待通りの応答をしないという能力の非対称性です。今回の発表は、AIの能力に関する誇張や誤解を招く可能性も指摘されており、AIの脅威を評価する上で慎重な検証が求められます。
