ロボット学習データ専業のXDOF、70億円調達
詳細を読む
ロボット学習データの収集・整備を専業とする米新興企業XDOFが2026年6月17日、ステルス状態を脱して事業を公開しました。Thrive CapitalやSpark Capital、a16zなどから7000万ドルを調達済みで、最先端AI研究所を含む20社とすでに取引しているといいます。AIの次の難所はモデルやチップではなく、ロボットに物理世界との対話を教えるためのデータの供給網だという賭けに出ています。
背景には、大規模言語モデルが公開テキストの海で学習できたのに対し、ロボットは物理的な接触を捉えたデータをほとんど持たないという事情があります。YouTube動画やギグワーカーの撮影映像は精度が低く、現実世界と整合させるのが難しいのが実情です。共同創業者でCEOのフィリップ・ウー氏はUCバークレーの博士課程でこの鶏と卵の問題に直面し、まずデータ収集の手段を作る必要があると痛感したと振り返ります。
ウー氏らは安価な遠隔操作システム「GELLO」を開発し、人がロボットアームを操作して学習データを生成する仕組みで注目を集めました。これを足がかりに2024年10月、ロボット開発企業向けのデータ基盤を提供するXDOFを立ち上げます。データ提供だけでは行き詰まると考え、洗浄・ツール・注釈までを手掛けることで自己強化型のフィードバックループを築く狙いです。
出発点として同社はUCバークレーのAI研究所と組み、これまでで最大級と称する高品質なロボット学習データ群「ABC」を公開します。13万件の操作軌跡、300時間のシミュレーション、100時間の評価データを含み、Tシャツたたみや箱の平たん化、AirPodsの収納といった作業の学習にすでに活用されました。学術界がこの規模の事前学習データを使えるのは初めてだといいます。
同社はデータピラミッドの3層で事業を展開する計画です。最も価値が高いのは実際に配備するロボット上で集める遠隔操作データで、次が汎用的な遠隔操作データ、最後が人が日常作業を行う一人称視点データで、ここでは独自の装着型センサーを開発します。なぜ大手研究所が自前でやらないのか。数十万平方フィートの倉庫と数百台のロボット、その校正と操作者育成が必要で、多くの研究所は外部委託を選ぶとウー氏は説明します。
社名のXDOFはロボット工学用語「自由度(degrees of freedom)」をもじったものです。人間の腕は肩から手首まで7自由度、Figure AIの最新ロボットは30自由度を持ちます。頭の「X」には任意かつ無限の自由度を目指すという同社の野心が込められています。物理AIが次のフロンティアとなる中、地味で泥臭いデータ収集こそが競争の鍵になるのか、注目が集まります。