GoogleがAI防衛戦略を強化、自動パッチAI「CodeMender」と報奨金制度を開始

2025年10月06日 Google Gemini エンジニア推論リスク脆弱性

自動パッチAI「CodeMender」

Gemini活用による複雑な脆弱性の自動修正

受動的／能動的防御アプローチの統合

人手によるレビュー前提の高品質パッチ提案

オープンソースに既に72件の修正を適用

AI特化の報奨金制度（VRP）

AI製品の脆弱性に特化したVRPを新設

最大報奨金は3万ドル（約450万円）

重点対象はAIによる「不正なアクション」

データ漏洩など実害のある脆弱性が対象

SAIF 2.0によるエージェント防御

自律型AIエージェントのリスクに対応

「制御・制限・可視化」の3原則を設定

SAIFリスクマップを業界団体に寄贈

@bioshok3のXポスト: GoogleDeepMindはCodeMender発表。コードの脆弱性を修正するマルチエージェントシステムで変更を加える前にコードについて推論し、変更が正しく、リグレッションが発生しないことを自動的に検証する強力なツールが装備されている。 https://t.co/tdk6dZ…

出典：DeepMind公式 | The Verge | Google公式

詳細を読む

Googleは、AIを攻撃ツールとして利用する悪質な脅威に対抗するため、包括的なAIセキュリティ戦略を始動しました。核となるのは、コードの脆弱性を自動修正するAIエージェント「CodeMender」の開発、AI製品に特化した報奨金制度「AI VRP」の新設、そして自律型エージェントの安全性を確保する「SAIF 2.0」へのフレームワーク拡張です。AIの力を防御側に決定的に傾けることを目指します。

中でも「CodeMender」は、ソフトウェア開発におけるセキュリティ対応のあり方を一変させる可能性があります。これはGeminiの高度な推論能力を活用し、複雑な脆弱性の根本原因を特定し、高品質なパッチを自動生成・適用するAIエージェントです。これにより、開発者は煩雑な修正作業から解放され、本質的な開発に集中できるようになります。

CodeMenderは、新しい脆弱性を即座に修正する「受動的」対応に加え、セキュアなコード構造への書き換えを促す「能動的」な防御も行います。既に、オープンソースプロジェクトに対し、人間によるレビューを経た72件のセキュリティ修正を適用しています。自己検証機能により、誤った修正や退行を防ぎながら、迅速なパッチ適用を実現します。

セキュリティ研究コミュニティとの連携を強化するため、GoogleはAI脆弱性報奨金制度（AI VRP）を立ち上げました。この制度では、LLMや生成AIシステムを悪用し、不正に動作させる「不正なアクション (Rogue Actions)」に関する報告に注力します。最高で3万ドル（約450万円）の報奨金が提供されます。

AI VRPは、データ漏洩やアカウント改ざんなど、セキュリティ上の実害を伴うAIの脆弱性を対象とします。例えば、プロンプトインジェクションにより、Google Homeに不正にドアを解錠させたり、機密情報を攻撃者のアカウントに要約・送信させたりするケースが該当します。単なるAIのハルシネーション（幻覚）は対象外です。

さらにGoogleは、自律的に動作するAIエージェントのセキュリティリスクに対応するため、「Secure AI Framework (SAIF) 2.0」を発表しました。このフレームワークでは、エージェントを安全に運用するための「人間による制御」「権限の制限」「行動の可視化」という3つのコア原則を掲げています。AIエージェントが普及する未来を見据えた業界標準の構築を推進しています。