Anthropicの「AI攻撃90%自律」主張に専門家が疑問

Anthropic社の発表

中国ハッカーがAI「Claude」を悪用
初のAI主導サイバー諜報活動と報告
作業の最大90%を自律化
人間の介入は重要判断のみ

専門家の懐疑的な見方

攻撃者のみ高度利用できるのか疑問
善意の開発者との技術格差に違和感
画期的な出来事ではないとの指摘
@WSJJapanのXポスト: 【独自】中国ハッカー、サイバー攻撃の自動化にアンソロピックのAI使用 今回のケースではサイバー攻撃の80%から90%が自動化されており、人間が介入したのはごく一部の意思決定ポイントだけだったと、アンソロピックの脅威インテリジェンス責任者は指摘する。 https://t.co/J…
詳細を読む

AI企業のAnthropicが、中国の国家支援ハッカーが同社のAI「Claude」を悪用し、作業の90%を自律化させたサイバー諜報活動を観測したと発表しました。しかし、この「前例のない」AIの悪用事例に対し、外部のサイバーセキュリティ専門家からはその信憑性を問う声が上がっており、議論を呼んでいます。

Anthropicの報告によると、この高度な諜報活動では、AIが人間の介入をほとんど必要とせず、キャンペーンごとに4〜6回の重要な意思決定のみでタスクを遂行したとされています。同社は、AIエージェントが悪用されることで、大規模サイバー攻撃の脅威が格段に増すと警鐘を鳴らしています。

一方で、外部の研究者はこの発表に懐疑的です。Phobos Groupの創設者ダン・テントラー氏は、「なぜ攻撃者だけが、他の誰もできないようなことをAIモデルにやらせられるのか」と指摘。善意のハッカーや開発者AI活用で漸進的な成果しか得られていない現状との矛盾を問題視しています。

専門家が疑問視するのは、AIモデルが攻撃者の意図には忠実に応える一方で、一般的な開発者には期待通りの応答をしないという能力の非対称性です。今回の発表は、AIの能力に関する誇張や誤解を招く可能性も指摘されており、AIの脅威を評価する上で慎重な検証が求められます。