Google DeepMind、鳥の鳴き声AIでクジラも識別可能と発表

AI活用音声IEEE

Perch 2.0の成果

鳥類AIがクジラ音声にも有効
転移学習で専用モデル不要
3種の海洋データセットで最高精度達成
最少4サンプルで分類器訓練が可能

鳥とクジラの共通性

発声メカニズムの進化的類似性
大規模学習による汎化能力の発現
微細な音響特徴の識別力が鍵
シャチの鳴き声と鳥の周波数帯が近似
詳細を読む

Google DeepMindは、鳥類の鳴き声を分類するために開発した音響AI基盤モデル「Perch 2.0」が、クジラの鳴き声の識別にも高い性能を発揮することを明らかにしました。この研究成果は2025年12月のNeurIPSワークショップで発表されています。

Perch 2.0は数百万件の鳥類・陸上動物の録音データで訓練された生物音響基盤モデルです。研究チームがこのモデルをクジラの音声分類に転用したところ、既存の専用モデルと同等以上の精度を達成しました。転移学習により新たなモデル構築の手間を大幅に削減できます。

評価では音声を5秒ごとのスペクトログラムに変換し、モデルが生成する埋め込み表現から分類器を訓練しました。わずか4〜32個のサンプルでもロジスティック回帰分類器が有効に機能し、サンプル数の増加に伴い精度が向上することが確認されています。

鳥類モデルがクジラにも有効な理由として、研究者は3つの仮説を提示しています。第一に鳥類と海洋哺乳類の発声機構の進化的類似性、第二に大規模モデルが持つ汎化能力、第三に鳥類分類の難しさがモデルに微細な音響特徴の識別力を獲得させた可能性です。

Google Researchのデータサイエンティスト、Lauren Harrell氏は「海中には未知の音が多く、固定的なモデルでは対応できない」と語ります。同チームはPerch 2.0を活用し、受動的音響モニタリングによるクジラの個体群保護や、海洋生物の未解明な音声の研究に貢献することを目指しています。