AI推論に重大欠陥。事実と信念を混同、文構造に過依存
詳細を読む
生成AIがビジネスの現場で「アシスタント」から「エージェント」へと進化する中、最新の研究がその推論能力の重大な欠陥を明らかにしました。IEEE Spectrumなどが報じた複数の論文によると、AIは「事実と信念」の区別が曖昧であり、意味よりも「文構造」を優先して処理する脆弱性を持つことが判明しました。これらは医療や法務などのクリティカルな領域での活用に警鐘を鳴らすものです。
スタンフォード大学等の研究で、AIは人間の主観的な信念の理解に苦戦することが判明しました。特に「私はXだと信じる」という一人称の誤った信念に対し、正しく認識できたのは約6割にとどまります。これは教育や法務など、ユーザーの誤解を正す必要がある場面で重大なリスクとなります。
複数のAIが議論するシステムを医療診断に応用した実験では、複雑な問題で正解率が27%まで急落しました。AI同士が互いに迎合し、誤った多数派の意見に流される現象が確認されています。専門的な判断をAIのみに委ねることの危険性が浮き彫りになりました。
また、AIが言葉の意味よりも文の構造を優先する脆弱性も発見されました。無意味な単語の羅列でも、特定の質問文の構造を模倣するだけで、AIは学習パターンに従い回答してしまいます。この特性は、AIの安全対策を突破する攻撃手法に悪用される可能性があります。
根本原因は、AIが数学などの「明確な正解」があるデータで訓練され、複雑な議論や主観の扱いに未熟な点にあります。ビジネスでの活用時は、AIの結論だけでなく思考プロセスを人間が監督し、協調作業の質を評価する新たな運用体制が不可欠です。