NVIDIA、合成データで現場の映像AI精度向上
再利用可能な開発基盤
詳細を読む
NVIDIAは6月30日、工場や都市など物理世界の映像をAIで自動解析する「ビジョンAIエージェント」の精度を高める3つのワークフローを公開しました。OpenUSDとNVIDIA Omniverseによる合成データ生成と、Metropolisによるモデル開発・展開を組み合わせ、開発者が一から構築せずに済む再利用可能な仕組みを提供します。エッジでの映像データが急増する一方、その多くが活用されていない現状を背景にした取り組みです。
背景には、現場データの未活用という課題があります。Gartnerの予測では2028年までに企業管理データの3分の2以上がデータセンターやクラウドの外で生成・処理され、エッジAIを導入する企業は2025年の10%から2029年には3分の2超に拡大します。しかし既存のエッジデータの最大90%が未処理のまま放置されているといいます。
精度向上を阻む典型的な壁は3つあります。まれな不良や異常を学習データが網羅できない「精度の頭打ち」、ラベル付けや実験管理を担う機械学習チームが社内にいない「微調整の専門知識不足」、そして映像パイプラインやモデル、検索、通知などを毎回つなぎ合わせる「複雑な構築作業」です。NVIDIAはこれらに対し、不良画像生成や映像データ拡張、TAOによる微調整、映像検索・要約(VSS)といった再利用可能なスキルとブループリントで対応します。
製造業の検品では、合成データが効果を発揮しています。RoboflowはNVIDIA Cosmosと不良画像生成スキルを自社プラットフォームに統合し、実データが乏しい場面で合成不良画像を生成します。Corningの光ファイバー製造の検証では、わずか8枚の実不良画像に合成データを加えて学習したモデルが、最難関の不良分類で平均精度95%・再現率100%を達成し、数四半期かかる検品プロジェクトを数日に短縮しました。
都市運用と産業現場でも成果が出ています。Linker VisionはVSSブループリントを用いて高雄市で開発工数を85%削減し、インシデント対応時間を最大80%短縮しました。Foxconnでは、DeepHowの作業手順検証エージェントがGB300サーバーの生産ラインで初回良品率を3%高め、重要工程の微細動作理解で99%の精度を実現しています。