AWS、Bedrockとトークン化連携 機密データの安全活用を実現
詳細を読む
アマゾン・ウェブ・サービス(AWS)は2025年9月23日、生成AIサービス「Amazon Bedrock」のセキュリティ機能「Guardrails」と、機密データを別の文字列に置き換える「トークナイゼーション」技術を統合する方法を発表しました。これにより、機密情報を保護しつつ、後工程でデータを活用できる「可逆性」を確保できます。金融など規制の厳しい業界での安全なAI活用が期待されます。
生成AIの業務利用が広がる中、顧客の個人情報といった機密データの取り扱いが大きな課題となっています。特に金融サービスなどでは、顧客情報にアクセスしつつ、個人を特定できる情報(PII)は厳格に保護する必要があります。AIの利便性とデータ保護の両立が求められているのです。
Amazon Bedrockの「Guardrails」機能は、入力プロンプトやモデルの応答に含まれるPIIを検出し、マスキングできます。しかし「{NAME}」のような一般的なマスクに置き換えるため、元のデータに戻すことができません。この「不可逆性」は、後工程で元データが必要となる業務の妨げとなっていました。
この課題を解決するのが「トークナイゼーション」です。機密データを、元のデータ形式を維持したまま、数学的に無関係な別の文字列(トークン)に置き換える技術です。マスキングと異なり、権限を持つシステムはトークンを元のデータに戻せるため、セキュリティとデータの可逆性を両立できます。
今回の手法では、Guardrailsの`ApplyGuardrail` APIを利用します。まずAPIでユーザー入力内のPIIを特定し、検出されたPIIをサードパーティ製のトークナイゼーションサービスに送ります。AIモデルには、そこで生成されたトークンで置き換えたデータを渡して処理を実行させるのです。
例えば、金融アドバイスアプリを考えます。顧客からの質問に含まれるメールアドレスや取引先名をトークン化します。AIはトークン化されたデータで安全に分析を行い、最終的な回答を生成する際に、サービス側で元の情報に戻して顧客に提示します。これにより、安全なデータフローが実現します。
このアーキテクチャにより、企業は機密情報を保護しながら、その有用性を損なうことなく生成AIを活用できます。特に規制の厳しい業界において、コンプライアンス要件とイノベーションを両立させる実用的な枠組みとなります。責任あるAIの導入を促進する重要な一歩と言えるでしょう。