NVIDIA、AIエージェントがロボットを自律訓練

自律訓練の仕組み

結束バンド切断とGPU装着を習得
成果上がる変更のみ保持し反復改善

ENPIREの構成

NVIDIA GEARとCMU・UCバークレーが開発
リセット・検証・評価・失敗分析の4機能
複数ロボットの並列評価

公開と展望

全要素のオープンソース化を表明
詳細を読む

NVIDIAのGEAR研究所は2026年6月、AIコーディングエージェントロボットの訓練を自律的に指揮する新たな枠組み「ENPIRE」を発表しました。カーネギーメロン大学とカリフォルニア大学バークレー校が共同開発したこの仕組みでは、エージェントが訓練手順を自ら考案し、ロボット結束バンドの切断やマザーボードへのGPU装着といった精密な作業を習得させました。

ENPIREは、AIモデルにツール利用や記憶・制約・フィードバックの機能を与える「エージェントハーネス」と呼ばれるソフトウェアです。具体的には4つのモジュールで構成され、作業の自動リセットと検証、ロボットの行動指針となる方策の改良、複数の実機を並列で動かす評価、そしてログ解析や論文の取り込みによる失敗対応を担います。

訓練は人手を介さず反復します。エージェントは独自のアルゴリズムを考えて実機で試し、成功率を高めた変更だけを残すサイクルを自己主導で繰り返します。NVIDIAでAI担当ディレクターを務めるジム・ファン氏は「研究所の一部が夜通し自己改善し、朝に報告書を読むだけだ」とLinkedInに投稿しました。

検証には3社のエージェントが使われました。OpenAIGPT-5.5を用いたCodexAnthropicOpus 4.7を用いたClaude Code、Moonshot AIのKimi K2.6を用いたKimi Codeです。チームを組んだエージェントが互いに異なる訓練手法を独立して編み出し、実験で比較しました。

ファン氏はすべてをオープンソース化する方針を示し、誰もが自宅で「自走するロボット研究所」を持てるようにすると述べました。技術的な詳細は6月16日に公開された研究論文にまとめられています。AIが自らハードウェアの訓練を回す時代が、研究現場で現実味を帯び始めています。