NVIDIA、合成データで現場の映像AI精度向上

再利用可能な開発基盤

Omniverseで合成データ生成
Metropolisが映像AIを統合
OpenUSDで3D環境を共有
TAOでモデルを微調整

現場での実証成果

不良画像生成精度95%
都市運用で開発工数85%削減
Foxconnで歩留まり3%改善
詳細を読む

NVIDIAは6月30日、工場や都市など物理世界の映像をAIで自動解析する「ビジョンAIエージェント」の精度を高める3つのワークフローを公開しました。OpenUSDとNVIDIA Omniverseによる合成データ生成と、Metropolisによるモデル開発・展開を組み合わせ、開発者が一から構築せずに済む再利用可能な仕組みを提供します。エッジでの映像データが急増する一方、その多くが活用されていない現状を背景にした取り組みです。

背景には、現場データの未活用という課題があります。Gartnerの予測では2028年までに企業管理データの3分の2以上がデータセンタークラウドの外で生成・処理され、エッジAIを導入する企業は2025年の10%から2029年には3分の2超に拡大します。しかし既存のエッジデータの最大90%が未処理のまま放置されているといいます。

精度向上を阻む典型的な壁は3つあります。まれな不良や異常を学習データが網羅できない「精度の頭打ち」、ラベル付けや実験管理を担う機械学習チームが社内にいない「微調整の専門知識不足」、そして映像パイプラインやモデル、検索、通知などを毎回つなぎ合わせる「複雑な構築作業」です。NVIDIAはこれらに対し、不良画像生成や映像データ拡張、TAOによる微調整、映像検索・要約(VSS)といった再利用可能なスキルとブループリントで対応します。

製造業の検品では、合成データが効果を発揮しています。RoboflowNVIDIA Cosmosと不良画像生成スキルを自社プラットフォームに統合し、実データが乏しい場面で合成不良画像を生成します。Corningの光ファイバー製造の検証では、わずか8枚の実不良画像に合成データを加えて学習したモデルが、最難関の不良分類で平均精度95%・再現率100%を達成し、数四半期かかる検品プロジェクトを数日に短縮しました。

都市運用と産業現場でも成果が出ています。Linker VisionはVSSブループリントを用いて高雄市で開発工数を85%削減し、インシデント対応時間を最大80%短縮しました。Foxconnでは、DeepHowの作業手順検証エージェントがGB300サーバーの生産ラインで初回良品率を3%高め、重要工程の微細動作理解で99%の精度を実現しています。