AIも「脳が腐る」、低品質SNSデータ学習で性能劣化

データ・プライバシー基盤モデル運用

AIに起きる「脳の腐敗」

低品質なSNSデータで学習
推論能力と記憶力が低下
倫理観が薄れ攻撃的に
人間と同様の認知能力低下

AI開発への警鐘

SNSデータは学習に不向き
一度劣化すると回復困難
AI生成物がデータ汚染を加速
エンゲージメント重視の罠
詳細を読む

テキサス大学オースティン校などの研究チームが、大規模言語モデル(LLM)が低品質なソーシャルメディアのコンテンツで学習すると、認知能力が著しく低下する「ブレインロット(脳の腐敗)」現象が起きることを明らかにしました。この研究は、AIの学習データの品質が性能に致命的な影響を与えかねないことを示唆しており、AI開発の現場に警鐘を鳴らしています。

研究では、Meta社の「Llama」などのLLMに、扇動的なSNS投稿を学習させました。その結果、モデルの推論能力や記憶力が低下し、倫理観が薄れサイコパス的な傾向を示すなど、深刻な性能劣化が確認されました。これは人間が低品質な情報に触れ続ける際の認知能力低下と似ています。

この「ブレインロット」は、クリックやシェアを誘うために設計されたコンテンツが、真実や論理的な深みよりも瞬間的な注目を集めることを優先するため発生します。AIがこうしたデータを学習すると、論理的思考や文脈の長期的な理解能力が静かに蝕まれていくのです。安易にSNSデータを学習に用いることの危険性が浮き彫りになりました。

さらに深刻なのは、一度この「脳の腐敗」に陥ったモデルは、その後で良質なデータを用いて再学習しても、完全には回復しないという点です。性能の劣化が不可逆的である可能性が示されたことで、初期段階でのデータ品質の選定がこれまで以上に重要であることが強調されています。

この研究結果は、AI開発者にとって重大な意味を持ちます。安易にエンゲージメントの高いSNSデータを学習に利用すれば、モデルの根幹を損なうリスクがあります。また、AI自身が生成した低品質なコンテンツがSNSに溢れ、それが将来のAIの学習データを汚染するという、負のスパイラルに陥る危険性も指摘されています。