Anthropic Mythos、政府機関が安全性評価に本腰

各国政府の対応

トランプ政権にモデル概要を説明
英AI安全研究所が独自評価を公表
大手銀行にもテスト参加を促進
国防総省との訴訟と並行して対話継続

サイバーセキュリティ能力の実態

単体タスクでは既存モデルと同水準
多段階攻撃の連鎖実行で突出
32ステップの侵入テストを初突破
限定公開の判断に一定の妥当性
詳細を読む

Anthropicの共同創業者ジャック・クラーク氏は2026年4月14日、同社の新モデルMythosについてトランプ政権にブリーフィングを行ったことを認めました。Mythos Previewはサイバーセキュリティ分野で突出した能力を持つとされ、一般公開が見送られている異例のAIモデルです。クラーク氏はSemafor World Economy Summitでの講演で、政府との連携の重要性を強調しました。

Anthropicは今年3月、国防総省からサプライチェーンリスク企業に指定されたことを受け連邦政府を提訴しています。軍によるAIの無制限利用、とりわけ国民の大規模監視や完全自律型兵器への転用に同社が反対したことが背景にあります。クラーク氏はこの指定を「狭い範囲の契約上の紛争」と位置づけ、訴訟が国家安全保障上の対話を妨げるべきではないとの立場を示しました。

一方、英国AI安全研究所(AISI)はMythos Previewのサイバー攻撃能力に関する独自評価を公表しました。個別のCTF(Capture the Flag)課題では、GPT-5.4やOpus 4.6など他の最新モデルと5〜10%程度の差にとどまり、単体タスクでの優位性は限定的でした。

しかしMythosが際立ったのは、多段階攻撃の連鎖実行能力です。AISIが開発した「The Last Ones」と呼ばれる32ステップの企業ネットワーク侵入シミュレーションで、Mythosは従来モデルが突破できなかった全工程を初めて完遂しました。このテストは訓練された人間でも約20時間を要する高難度の課題です。

トランプ政権関係者がJPモルガンやゴールドマン・サックスなど大手銀行にMythosのテストを促しているとの報道もあり、金融業界への影響も注目されています。クラーク氏はAIによる雇用への影響について、現時点では「一部の大学院卒の初期雇用にわずかな弱さ」が見られる程度としつつも、大規模な雇用変動に備えていると述べました。