NVIDIA、物理AIエージェントスキルをCVPRで公開
詳細を読む
2026年6月3日、NVIDIAはデンバーで開催中のCVPR 2026において、自動運転車・ロボット・ビジョンAIの開発を加速する物理AIエージェントスキル群を発表しました。先日公開されたオープン基盤モデルCosmos 3と連携し、シーン再構築から合成データ生成、ポリシー訓練、評価までの断片的だったワークフローを一気通貫で自動化します。すべてのツールはGitHubでオープン公開されています。
自動運転分野では、走行データから編集可能な3Dシーンを生成するNeural Reconstructionスキルや、数千GPUで強化学習を並列実行するオープンソースフレームワークAlpaGymを提供します。さらに320億パラメータの推論型VLAモデルAlpamayo 2 Superは、認識から計画・行動までの全スタックを統合し、レベル4自動運転の開発基盤となります。研究論文LCDriveは、テキスト推論を潜在表現に圧縮することでトークン数を約半分に削減し、車載ハードウェアでの高速推論を実現しました。
ロボティクス分野では、Isaac Sim 6.0とIsaac Labにエージェント対応スキルを統合し、シーン作成からシミュレーション実行、データ取得まで自動化しました。注目すべきは研究論文GraspGen-Xです。20億回のシミュレーション把持データで訓練された初の把持基盤モデルで、未知のグリッパーと未知の物体に対してゼロショットで把持姿勢を生成できます。ロボット開発者がグリッパーごとに訓練し直す必要がなくなるのでしょうか。
ビジョンAIでは、Metropolisスキルが合成異常データの生成や疑似ラベリングを自動化し、外観検査モデルの精度向上を支援します。また、ゲーム環境で訓練した汎用エージェント基盤モデルNitroGenは1,000以上のゲームと4万時間の操作データから学習し、少数データ環境で従来手法比52%の性能向上を達成しました。NVIDIAの物理AIデータセットはHugging Faceで累計1,500万ダウンロードを超え、研究インフラとしての存在感を強めています。