世界最大級の生物学AI「BioCLIP 2」始動、2億枚で学習
出典:NVIDIA公式
詳細を読む
オハイオ州立大学の研究チームは、NVIDIAなどの支援を受け、世界最大級の生物学基盤モデル「BioCLIP 2」を発表しました。2億枚以上の画像データで学習されたこのAIは、従来の画像認識を超え、生物の複雑な関係性や特性を理解する能力を備えています。
基盤となるデータセット「TREEOFLIFE-200M」は、サルの仲間から植物まで92万以上の分類群を網羅しています。スミソニアン博物館などと協力して構築されたこの膨大なデータを、NVIDIA H100 GPUを用いてわずか10日間で学習させました。
特筆すべきは、教えられていない概念を理解する推論能力です。例えば、鳥のくちばしの大きさ順に並べたり、同種内のオスとメス、あるいは成体と幼体を区別したりできます。さらには、植物の葉の画像から病気の有無や種類を特定することさえ可能です。
このモデルは、絶滅危惧種の個体数推定など、データが不足している分野での活用が期待されています。既存のデータを補完することで、より効果的な生物多様性の保全活動を支援する「科学的プラットフォーム」としての役割を担います。
研究チームは次なる段階として、野生生物の「デジタルツイン」開発を見据えています。生態系の相互作用を仮想空間でシミュレーションすることで、実際の環境を破壊することなく、複雑な生態系の研究や教育が可能になるでしょう。