ロボティクス(産業・業界)に関するニュース一覧

Nanoleafがロボット・AI・健康分野へ事業転換

スマート照明の限界

Matter普及で照明のコモディティ化進行
Ikea等が低価格スマート電球を投入
過去2年間の新製品投入が停滞

AIとロボティクスへの挑戦

エンボディドAI製品を年内3種発売予定
AI玩具・デスク型コンパニオン・ロボコントローラを開発中
照明のオープンAPI公開とオープンソース化を計画

健康デバイス事業の拡大

赤色光セラピーマスクがトップセラーに成長
加温・振動機能付き新製品4種を年内投入

スマート照明で知られるNanoleafが、ロボティクス・AI・ウェルネスの3分野へ事業を大幅に転換する方針を明らかにしました。CEOのGimmy Chu氏は「スマートホームは退屈になりつつある」と述べ、Matterなどのオープン規格の普及によりスマート照明がコモディティ化している現状を転換の理由に挙げています。

AI分野ではエンボディドAI(物理世界と連動するAI)に注力します。年内にAI搭載の玩具、デスクコンパニオン、ロボット用マイクロコントローラの3製品を投入する計画です。Chu氏は「単にスピーカーにChatGPTを入れるのではなく、実際に役立つハードウェアに知能を組み込む」と差別化の方向性を示しました。幼児の発達支援に関連する製品も含まれるとしています。

ウェルネス事業では、2025年に発売した赤色光セラピーマスクが同社のトップセラー製品の一つに成長しています。LED照明とサプライチェーンの専門知識を活かし、米国市場で手頃な価格帯を実現しました。今年はさらに加温・マッサージ・振動機能を備えた新製品4種を発売する予定です。

一方、照明事業も継続します。売上の80〜90%は依然として照明が占めており、Matter 1.4対応を近日中に展開し、年内にはMatter 1.5対応製品も発売します。全製品のAPIをオープン化し、将来的にはコードのオープンソース化も視野に入れています。Chu氏は「デバイスをオープンにするほどAIとの互換性が高まる」とIoTの将来像を語りました。

ただし、この戦略転換にはリスクも伴います。AI搭載コンパニオンやウェルネスガジェットの市場は、科学的根拠と過剰な期待が混在する領域です。既存のスマート照明ユーザーからは、新分野への投資よりも照明エコシステムの強化を求める声も上がっています。Matterの普及でデバイスの差別化が困難になる中、Nanoleafが独自のポジションを築けるかが今後の焦点となります。

SpaceX、テキサスにAI半導体工場へ550億ドル投資

Terafab工場の概要

初期投資額550億ドルの巨大計画
追加フェーズで最大1190億ドル規模に
年間200GW相当の演算能力を目標

事業体制と用途

SpaceXTeslaが共同運営
Intelが設計・製造で協力
テキサス州で税制優遇を申請中

SpaceXがテキサス州オースティンに建設を計画するAI半導体工場「Terafab」の投資額が、少なくとも550億ドル(約8兆円)に達することが明らかになりました。テキサス州グライムス郡に提出された公聴会通知の詳細から判明したもので、税制優遇措置の申請に伴い公開されました。

追加フェーズが建設された場合、投資総額は最大1190億ドルに膨らむ可能性があります。イーロン・マスク氏が3月にプロジェクトを発表した際には、地球上で年間200ギガワット、宇宙空間で最大1テラワットの演算能力を支えるチップ生産を目指すという野心的な構想を示していました。

同工場はSpaceXTeslaが共同で運営し、製造されるチップはAI、ロボティクス、宇宙データセンターに活用されます。先月にはIntelがTerafabの設計・製造に協力すると発表しており、超高性能チップの大規模生産を支援する体制が整いつつあります。

SpaceXはすでにテネシー州メンフィスでデータセンター「Colossus」を運営しており、最近AnthropicのAIモデルに演算能力を提供する契約を締結しています。半導体製造からデータセンター運営まで一貫した垂直統合を進めることで、AI基盤インフラにおける支配的な地位を築く狙いです。

SpaceX、テキサス州に最大1190億ドルの半導体工場を計画

Terafab構想の全容

初期投資550億ドルの大型計画
総額1190億ドル規模に拡大の可能性
AI・衛星・自動運転向けチップを製造
Intelが製造パートナーとして参画

背景と今後の展望

xAIGrok訓練に大量計算資源が必要
既存メーカーの供給速度に不満
テキサス州Grimes郡が候補地の一つ
SpaceXxAI統合企業は評価額1.25兆ドル

SpaceXが、テキサス州Grimes郡に次世代半導体製造施設「Terafab」の建設を検討していることが、同郡のウェブサイトに掲載された提案書類から明らかになりました。初期投資額は550億ドル(約8.2兆円)で、最終的には総額1190億ドル(約17.8兆円)に達する可能性があります。施設は「多段階の垂直統合型半導体製造・先端コンピューティング施設」と位置づけられています。

Terafab構想は、イーロン・マスク氏が以前から公表していたもので、SpaceX傘下のAI企業xAITeslaが共同で資源を投入します。半導体大手のIntelも製造パートナーとして参画しており、AIサーバー、衛星通信、SpaceXが構想する宇宙データセンター、さらにTeslaの自動運転車やロボット向けのチップ開発を目指しています。

マスク氏は、将来的に年間1テラワット相当のチップを製造する能力を持つ施設にする考えを示しています。既存の半導体メーカーが自社のAI・ロボティクス需要に見合う速度でチップを製造できていないことが、自社工場建設に踏み切る理由だと説明しました。「Terafabを建てるか、チップがないか。チップが必要だから建てる」と述べています。

ただし、マスク氏は5月6日の投稿で、Grimes郡はあくまで複数の候補地のうちの一つだと補足しています。この動きの背景には、xAIGrokシリーズの訓練・運用に必要な膨大な計算資源の確保があります。SpaceXxAIを統合した企業体の評価額1.25兆ドルとされ、6月のIPOも取り沙汰されています。

Hugging Faceがロボット用アプリストアを開設、200超のアプリ公開

アプリストアの概要

Reachy Mini向け専用ストア開設
コミュニティ製200超のアプリを無料提供
AI活用コード不要のアプリ開発
ブラウザ上の3Dシミュレーターも搭載

低価格ロボットの普及

299ドルからの手頃な価格設定
累計販売台数は約1万台に到達
直近2週間で3,000台を販売
オープンソースで全設計を公開

Hugging Faceは2026年5月6日、同社の小型デスクトップロボットReachy Mini」向けのアプリストアを正式に開設しました。ストアにはすでにコミュニティが開発した200以上のアプリが登録されており、Reachy Miniのオーナーは無料でダウンロードできます。これまでロボティクス開発には高度な専門知識が必要でしたが、AIエージェントの支援により、プログラミング経験のない一般ユーザーでも1時間以内にアプリを開発・公開できる環境が整いました。

アプリ開発の鍵となるのは、Hugging Faceが提供するAIエージェントML Intern」です。ユーザーは「誰かがおはようと言ったら手を振って」といった自然言語で動作を指示するだけで、エージェントがコード生成からテスト、パッケージ化までを自動処理します。プラットフォームはモデル非依存で、GPT-5.5やClaude Opus 4.6など外部モデルも利用可能です。

Reachy Miniは299ドルのUSB接続版と449ドルのワイヤレス版の2モデルを展開しています。2025年7月の発売以降、累計約1万台を販売し、直近2週間だけで3,000台が売れるなど需要が加速しています。Boston Dynamicsの約7万ドルのSpotや中国ロボットの1,900ドル以上という価格帯と比較すると、圧倒的な低価格が普及を後押ししています。

ストアに登録されたアプリのジャンルは多岐にわたります。チェスをしながらユーザーの悪手をからかうアプリ、スマートフォンを触ると仕事に戻るよう促すアプリ、発音を矯正する語学チューター、F1レースの実況アプリなど、150人以上のクリエイターが参加しています。その多くはロボティクスのコードを書いた経験がないユーザーです。

CEOのClément Delangue氏は、今後AIモデル開発者がRobotics能力のテスト場としてReechy Miniを活用するようになるとの見通しを示しました。全コードがオープンソースで公開されているため、エージェントハードウェアとの連携方法を学習しやすく、開発速度の加速が期待されます。ロボティクス専門家だけのものではなく、誰もが参加できる「ホビイスト時代」に入ったことを象徴する動きといえます。

Genesis AIが人間大ロボットハンドと基盤モデルを公開

フルスタック戦略

独自の人間サイズハンド開発
基盤モデルGENE-26.5を公開
センサー搭載グローブでデータ収集
シード資金1億500万ドル調達済み

技術と今後の展開

料理やルービックキューブを実演
シミュレーションモデル反復加速
欧米3拠点で60人体制
汎用全身ロボットも近く発表予定

ロボティクスAIスタートアップGenesis AIは2026年5月6日、独自開発した人間サイズのロボットハンドと初の基盤モデルGENE-26.5を公開しました。同社はKhosla VenturesやEclipseが共同リードした1億500万ドルのシードラウンドで資金を調達しており、ソフトウェアとハードウェアの両方を自社で手がける「フルスタック」戦略を打ち出しています。

最大の特徴は、ロボットハンドが人間の手と同じサイズ・形状で設計されている点です。多くのロボティクス企業が2本指のグリッパーを使う中、Genesis AIは人間の手に近い構造を採用することで、実世界との差異、いわゆる「エンボディメントギャップ」を縮小しました。共同創業者でCEOのZhou Xian氏は「人間の手を可能な限り模倣するロボットハンドを設計すれば、大量の人間データを即座に活用できる」と説明しています。

デモ動画では、卵を割りトマトを切る調理タスクや、ピアノ演奏、ルービックキューブの解法、実験室作業など多彩なタスクが披露されました。共同創業者Mistral AI出身のTheophile Gervet氏は、調理タスクが一連の複雑な動作を長時間こなす能力の証明になると強調しています。加えて、同社はセンサーを搭載した軽量グローブも開発しており、製薬や製造業の現場で作業者が装着するだけでロボット訓練用データを収集できる仕組みを構想しています。

Genesis AIはパリ、ロンドン、カリフォルニアに拠点を持ち、約60人の体制で欧米の人材を活用しています。元Google CEOのEric Schmidt氏も出資者に名を連ね、「ロボティクス業界にとって重要なマイルストーンだ」と評価しました。同社は近くハンドだけでなく全身の汎用ロボットを発表する計画で、Zhou氏は「最も高性能なロボットシステムの構築」を目標に掲げています。

DAIMON、ロボット触覚の大規模データセットを公開

触覚センサーの技術優位

指先サイズに11万超の感知ユニット搭載
視覚ベースの単色触覚センシング技術
力・滑り・摩擦・材質を同時に検出

データセットと業界連携

1万時間分のデータをオープンソース化
Google DeepMindら国際機関と共同開発
80以上の実環境・2000超の人間スキルを収録

VTLAモデルの提唱

触覚を視覚と同格の入力に引き上げ
コンビニ・ホテルなど実用展開を想定

香港発のスタートアップDAIMON Roboticsが、ロボットの物理的AI向けとしては世界最大規模のマルチモーダルデータセット「Daimon-Infinity」を公開しました。高解像度の触覚センシングデータを含み、洗濯物の折りたたみから工場の組み立てラインまで幅広いタスクをカバーしています。Google DeepMind、ノースウェスタン大学、シンガポール国立大学などが開発に参加しています。

同社の中核技術は、指先サイズのモジュールに11万個以上の感知ユニットを搭載した単色視覚ベース触覚センサーです。接触力だけでなく、変形・滑り・摩擦・材質・表面テクスチャまで記録でき、物理的なインタラクションの包括的な再構築を可能にします。分散型のラボ外データ収集ネットワークにより、年間数百万時間規模のデータ生成能力を持つとしています。

共同創業者のMichael Yu Wang教授は、現在主流のVision-Language-Action(VLA)モデルに触覚を加えたVision-Tactile-Language-Action(VTLA)アーキテクチャを提唱しています。触覚なしではロボットは暗所での物体認識や繊細な物体の把持に失敗しやすく、精密な力制御ができないと指摘します。視覚ベースの触覚センサーは画像形式でデータを出力するため、VLAフレームワークとの統合が自然に行える点が強みです。

ビジネスモデルは「3D」戦略として、デバイス(Devices)・データ(Data)・展開(Deployment)の垂直統合を掲げています。業界全体のデータ不足を解消するため、1万時間分のデータをオープンソース化しました。すでに中国のコンビニエンスストアでは、密集した棚から商品を取り出すために3本指での巧緻な操作が求められる場面でのロボット導入が検討されています。

Wang教授はカーネギーメロン大学でロボット操作の研究を始め、香港科技大学にロボティクス研究所を設立した経歴を持ちます。ロボットの巧緻操作は長年進展が遅かったものの、AIとハードウェアの同時進化により実用化の条件が整いつつあるとの見方を示しています。同社は将来的に、ロボットが家庭や日常生活に溶け込む「信頼できるパートナー」となることを目指しています。

SenseTime、高速画像生成の新モデルを公開

モデルの技術的特徴

画像テキスト変換せず直接処理
既存モデルより大幅に高速な生成
PCやスマホでも動作可能な軽量設計

中国半導体との連携

中国チップ10社が互換性を確認
オープンソースで国際連携を維持
ロボティクス分野への応用を視野

SenseTimeの戦略転換

顔認識大手から生成AIへ軸足
反復速度重視でオープンソース選択

米国の制裁対象である中国AI企業SenseTimeは4月29日、オープンソースの画像生成モデル「SenseNova U1」を公開しました。同モデルは画像をテキストに変換せず直接処理する独自技術「NEO-Unify」を採用しており、米国の競合モデルを大幅に上回る速度で画像の生成と解釈が可能だと同社は主張しています。

U1の最大の特徴は、画像をネイティブに「読む」能力にあります。従来のモデルが画像を一度テキストに変換して処理するのに対し、U1は画像のまま推論を行うことで処理速度を向上させ、必要な計算資源を削減しています。共同創業者のDahua Lin氏は「モデルの推論プロセスはもはやテキストに限定されない」と述べています。モデルはPCやスマートフォンでも動作可能な軽量設計で、幅広い活用が期待されます。

注目すべきは、U1が中国チップで動作する点です。公開日にはCambricon、Biren Technologyなど10社の中国半導体メーカーが互換性を発表しました。米国の輸出規制により最先端AI半導体へのアクセスが制限される中、中国チップへの対応は戦略的に重要な意味を持ちます。SenseTimeはHugging FaceGitHubでモデルを無料公開しており、中国企業がオープンソースAIの主要な貢献者となっている傾向をさらに強めています。

技術的な性能面では、U1は市場の全オープンソースモデルを上回る画質を実現したとSenseTimeは主張しています。AlibabaのQwenByteDanceのSeedreamといった中国のクローズドソースモデルに匹敵する一方、OpenAIGPT-Image-2.0にはまだ及ばないとされています。ただし速度面ではこれらすべてのモデルを凌駕するとのことです。

SenseTimeはかつて顔認識技術で世界をリードしていましたが、ChatGPT以降の生成AIブームでDeepSeekやMiniMaxなど新興企業に後れを取っていました。同社はオープンソース戦略により研究者からのフィードバックを得て反復速度を高める方針に転換。Lin氏は「オープンかクローズドかではなく、反復の速度こそが勝敗を分ける」と語っています。また、この技術はロボットが視覚情報を高速に処理するうえで特に有用であり、中国ヒューマノイドロボット市場への展開も見据えています。

Runway CEOが動画生成の先にある世界モデルを次の主戦場と宣言

世界モデルへの転換

動画生成から汎用世界モデルへ拡張
ゲーム・ロボティクスAGIへの応用視野
GoogleOpenAIと最前線で競合

Runwayの現在地

累計調達額約8.6億ドル
評価額53億ドルでの資金調達完了
リアルタイム動画生成による新領域開拓
映画産業の構造変革を提唱

AI動画生成スタートアップRunwayの共同創業者兼CEOであるCristóbal Valenzuela氏が、TechCrunchのポッドキャストに出演し、同社の今後の方向性について語りました。Valenzuela氏は、AI動画生成は通過点に過ぎず、真の目標はゲームやロボティクス、さらには汎用知能に応用可能な「世界モデル」の構築にあると明言しています。

Runwayはニューヨークに拠点を置き、これまでに約8億6,000万ドルを調達し、直近の評価額は53億ドルに達しています。同社のモデルはGoogleOpenAIといった資金力のある大手ラボと正面から競い合う位置にあります。動画生成技術にとどまらず、世界モデルという新たなカテゴリーでの差別化を図っています。

Valenzuela氏は「非線形メディア」という概念にも言及し、リアルタイムの動画生成コンテンツ制作をはるかに超える活用領域を開くと説明しています。映画産業については、1本の1億ドル大作を作る代わりに50本の映画を制作できる可能性があると述べ、技術がクリエイティブの制約を根本から変えると主張しました。

一方で、AIコンパニオンが「本質的にディストピア的だ」とする見方には反論し、技術の活用次第で多様な可能性があるとの立場を示しています。Runwayが目指す世界モデルは、単なる動画ツールから汎用AIプラットフォームへの進化を意味しており、今後の競争の行方が注目されます。

Vercel AIアクセラレーター2026年デモデー開催

プログラムの概要と内容

39チームがデモデーに登壇
6週間の集中プログラム実施
技術ワークショップと講演を毎週開催
総額800万ドルのクレジット提供

受賞チームと成果

優勝はエンタープライズ財務AI「Rex」
2位はセキュリティAI「Hacktron AI」
3位は不動産AI「Roots」
前回卒業生が累計1億ドル超を資金調達

Vercelは4月16日、サンフランシスコ本社で2026年AIアクセラレーターのデモデーを開催しました。39チームが6週間の集中プログラムを経て、投資家やAI業界のリーダーの前でプレゼンテーションを行いました。参加チームはエージェント開発者ツール、消費者向けアプリ、金融・セキュリティヘルスケアロボティクスなど幅広い分野でAIプロダクトを構築しています。

プログラム期間中、参加チームは毎週2回のセッションに参加しました。技術ワークショップではエージェントやモデルからデプロイ、スケーリングまでの実践的な内容が扱われ、ファイアサイドチャットではOpenAIWindsurfのチームなど業界リーダーが登壇しました。プログラム中盤にはBuilder Dayが開催され、AWSAnthropicエンジニアとのオフィスアワーも実施されています。

各チームにはVercelおよびパートナー企業から合計800万ドル相当のインフラストラクチャとクレジットが提供されました。パートナーにはAWSAnthropicOpenAI、Browserbase、ElevenLabs、Auth0、WorkOS、Notion、Modal、Neon、Supabaseなどが名を連ねています。

デモデーでは問題の妥当性、技術適合性、プロダクト品質、ピッチ内容の4項目で審査が行われました。優勝したRexはエンタープライズ向け財務バックオフィスAIを開発しており、Vercel Venturesからの投資も獲得しています。2位のHacktron AIはAIが生成するコードの脆弱性を検出・修復するセキュリティツール、3位のRootsは不動産取引のAI化に取り組んでいます。

前回2025年コホートの卒業生40社は累計1億ドル以上のベンチャー資金を調達しており、複数のチームがY Combinatorにも採択されています。2025年の優勝チームStablyはエンタープライズの試験導入を契約に転換し、数時間で新プロダクトラインを出荷できる体制を実現しました。次回コホートの募集は年内に開始予定です。

JAL、羽田空港で人型ロボットの荷物仕分け試験へ

実証実験の概要

2026年5月に羽田空港で開始
手荷物仕分けや貨物積載が対象
客室清掃や地上支援業務も検討
2028年まで試験継続の予定

導入の背景と狙い

訪日旅客急増で人手不足が深刻化
最新AIモデルで環境適応力を検証
専用設備なしでの作業実現が目標
JAL子会社とGMO社の共同実施

日本航空(JAL)は2026年5月から、東京・羽田空港でヒューマノイドロボットによる手荷物の仕分けや貨物の積み込みを行う実証実験を開始します。訪日旅客数の急増に伴う深刻な人手不足を解消する狙いがあり、JALの子会社であるJALグランドサービスとGMO AI&ロボティクスが共同で実施します。

試験は2028年まで継続される予定です。手荷物の仕分け作業にとどまらず、航空機の客室清掃や手荷物カートなどの地上支援機材の操作といった幅広い空港業務への適用が検討されています。羽田空港を利用する旅客が、稼働中のロボットを目にする機会も出てくるかもしれません。

ヒューマノイドロボットはすでに自動車工場や倉庫での試験運用が始まっていますが、従来の産業用ロボットは組立ラインなどで同じ作業を繰り返す専用機が中心でした。空港のようなオープンで予測困難な環境で人型ロボットが機能するかどうかは、大きな技術的課題です。

JALは、最新のAIモデルを搭載したヒューマノイドロボットが、専用の作業ステーションや大幅な職場改修を必要とせず、人間の作業環境にどこまで適応できるかを検証したい考えです。空港という複雑な現場での成功は、他の業界にもロボット活用が広がる契機となる可能性があります。

SusHi Tech東京、AI等4分野で27日開幕

4つの技術領域

AIインフラの実用展示
ロボティクスの体験型デモ
都市防災とサイバー防衛
アニメ・エンタメとAI融合

国際連携と注目点

TechCrunchが公式提携
Startup Battlefieldと連動
55都市の首長が防災議論
遠隔参加の仕組みも提供

東京都主催の技術カンファレンス「SusHi Tech Tokyo 2026」が4月27日から29日まで東京ビッグサイトで開催されます。AI、ロボティクス、都市レジリエンス、エンターテインメントの4つの技術領域に特化し、各分野で実演展示や専門セッションが組まれています。

AI領域ではNVIDIAのHoward Wright氏やAWSのRob Chu氏が登壇し、AIの大規模導入事例とリスクを議論します。ロボティクス領域では日産やいすゞが参加し、ソフトウェア定義車両による交通変革をテーマに実機デモが行われます。

都市レジリエンス分野では、トレンドマイクロのEva Chen氏やNECの中谷昇氏がサイバー防衛を、Breakthrough EnergyやCleantech Groupが気候テック投資の動向を語ります。VR災害シミュレーターや東京の地下治水施設の見学ツアーも用意されています。

エンターテインメント領域では、Production I.GMAPPA、コミックス・ウェーブ・フィルムのCEOが登壇し、東京をアニメーションの世界的拠点にするための戦略を議論します。AIを活用したマンガ翻訳や音楽生成スタートアップも出展予定です。

メディアパートナーとしてTechCrunchが参加し、SusHi Tech ChallengeからStartup Battlefield 200への選出も行われます。また、5大陸55都市の首長が集まる「G-NETS」サミットも併催され、気候変動と災害に強い都市づくりが議論されます。遠隔参加者向けには、現地スタッフが代わりに会場を回る独自の仕組みも提供されています。

Apple新CEO テルナス氏、AI搭載デバイス中心の戦略へ

ハードウェア重視の新体制

テルナス氏が年内にCEO就任
ハードウェア畑25年の経験
AI搭載ウェアラブルの開発加速

次世代デバイスの展望

折りたたみiPhone9月発売予定
スマートグラスやAIペンダント構想
家庭用ロボット開発も推進

サプライチェーンの課題

中国製造への依存度が約80%
インド生産を25%に拡大

Appleは、2026年後半にジョン・テルナス氏がティム・クック氏の後任として新CEOに就任すると発表しました。テルナス氏は2001年にAppleに入社し、AirPodsApple WatchVision Proなどの主要製品を手がけてきたハードウェアエンジニアリングの責任者です。この人事は、Appleが次の成長フェーズをハードウェア主導で切り開く方針を示しています。

テルナス氏のもとでAppleは、巨大AIモデルの開発競争に正面から参入するのではなく、AI機能を内蔵したデバイスそのものに注力する戦略を採ると見られています。具体的には、スマートグラスやカメラ内蔵ペンダント、AI機能付きAirPodsなど、iPhoneと連携するウェアラブル製品群の開発が進行中です。いずれもSiriが中核的な役割を担う設計とされています。

長年噂されてきた折りたたみiPhoneも、2026年9月の発売が見込まれており、テルナス新体制初の大型ローンチとなります。さらに、ディスプレイ付きロボットアームを搭載した卓上型デバイスや、家庭内を移動するモバイルロボットなど、ロボティクス分野への参入も検討されています。テルナス氏は大学時代に四肢麻痺患者向けのロボット制御装置を開発した経歴があり、この分野への関心は一貫しています。

一方で、新体制にはサプライチェーン上の課題も待ち受けています。iPhoneの約80%は関税発動前に中国で生産されていましたが、トランプ政権関税政策の影響を受け、Appleインドでの生産を拡大し、昨年は全体の約25%をインドで製造しました。メモリチップ不足や関税の不透明さも加わり、ハードウェア中心の戦略を推進するうえで、製造拠点の多角化が重要な経営課題となっています。

NVIDIA AIで地球を守る5つの取り組み

気候・防災への応用

Earth-2で高精度気象予測
津波警報を従来比100億倍高速化
衛星画像処理を秒単位に短縮

環境保全と資源循環

オランウータン巣の自動検出
AI選別で廃棄物回収率90%達成
リサイクル施設のCO2排出大幅削減
Planet社の地球観測データ即時分析

NVIDIAはアースデーに合わせ、AI技術で地球環境を保護する5つのプロジェクトを紹介しました。気候シミュレーション基盤「Earth-2」による高精度気象予測、絶滅危惧種オランウータンの保全、AIロボティクスによるリサイクル、津波早期警報、衛星画像のリアルタイム解析という5分野で、加速コンピューティングが環境課題の解決を後押ししています。

気象分野では、Earth-2がオープンなAI気象ソフトウェアスタックとして観測データの前処理から15日間の予測まで全工程を高速化します。Earth-2 Nowcastingは生成AIを活用し、国規模の予測をキロメートル解像度・6時間先までの局地予報に数分で変換します。データ同化モデル「HealDA」はNOAAやMITREと共同開発され、単一GPUで大気の全球スナップショットを数分で生成できます。

野生動物保全では、ボルネオとスマトラの熱帯雨林でGPU加速AIがオランウータンの巣をドローン画像から自動検出する研究が成果を上げています。従来は1時間のドローン飛行で30時間の画像分析が必要でしたが、AIモデルは1,800枚の画像を5分以内に処理します。InceptionV3ベースのモデルは99%超の精度を達成し、3種すべてが絶滅危惧種であるオランウータンの迅速な個体数モニタリングを可能にしています。

リサイクル分野では、NVIDIA InceptionメンバーのAMP社がAIロボティクスで廃棄物回収率90%を実現し、従来施設の約75%を大きく上回っています。これまでに20億ポンド以上の素材を埋立処分から転換し、推定73万9千トンのCO2排出を削減しました。NVIDIA Hopper GPUの採用でAI推論の消費電力も半減しています。

防災では、テキサス大学オースティン校のチームがカスカディア断層の津波予測でACMゴードンベル賞を受賞しました。物理モデルの事前計算とGPU処理により、従来手法の100億倍の速度で津波予測を完了し、沿岸住民の避難時間を確保します。また、Planet社はNVIDIAとの協業で衛星の生データからの画像処理パイプラインをGPUネイティブで構築し、山火事などの災害情報を従来の数時間から秒単位で提供する基盤を整えています。

NVIDIAがハノーバーメッセでAI製造業の未来を披露

AIインフラと設計革新

欧州最大級の産業用AIクラウドを独で展開
SiemensやDassaultらがAI物理シミュレーション統合
デジタルツインで工場全体の最適化を実現

工場へのAIエージェントとロボット

視覚AIエージェント品質管理を自動化
ヒューマノイドがSiemens工場で自律物流を実証
開発期間を従来の2年から7カ月に短縮
BMW工場でも人型ロボット配備を予定

2026年4月20日から24日にかけてドイツ・ハノーバーで開催されるハノーバーメッセ2026で、NVIDIAとパートナー企業群がAI駆動型製造業の最新成果を展示します。加速コンピューティング、AI物理シミュレーション、AIエージェントヒューマノイドロボットなど、産業革新の全領域にわたるデモンストレーションが行われます。

インフラ面では、Deutsche TelekomがNVIDIA AI基盤上に構築した欧州最大級の産業用AIクラウドが注目されます。Siemens、SAP、Agile Robotsなどがこのソブリンプラットフォーム上でリアルタイムシミュレーションデジタルツインを稼働させ、製造業のAI活用基盤として位置づけています。

工場運営の分野では、NVIDIA MetropolisライブラリとCosmosモデルを活用した視覚AIエージェント品質管理や安全監視を変革しています。Invisible AIのビジョン実行システムはトヨタの自動車工場で成果を上げており、Tulip InterfacesのFactory Playbackは歩留まり3%向上とリワーク10%削減が見込まれています。

ロボティクス領域では、Humanoid社のHMND 01がドイツ・エアランゲンのSiemens工場で自律物流作業を完了しました。NVIDIA Jetson Thorモジュールを搭載し、Isaac SimとIsaac Labによるシミュレーションファーストの開発手法で、従来最大2年かかるハードウェア開発を7カ月に圧縮しています。

さらにHexagon Roboticsの人型ロボットAEONがBMWライプツィヒ工場で組立作業に投入予定であり、ドイツの生産現場におけるヒューマノイド初導入事例の一つとなります。SCHUNKのGROWオートメーションセルも、中小企業向けにフィジカルAIを標準化・展開可能な形で提供し、欧州製造業全体への普及を目指しています。

Physical Intelligence、未学習タスクをこなすロボット汎用AIを発表

π0.7の汎化能力

学習外タスクへの構成的汎化を実現
訓練データ2件のみでエアフライヤー操作に成功
言語指示で成功率5%から95%に向上

実用化への課題と展望

単一指示での複雑な自律動作は未達成
専用モデルと同等の性能をコーヒーや洗濯物畳みで確認
標準ベンチマーク不在が外部検証の壁
評価額56億ドル、110億ドルでの資金調達を協議中

サンフランシスコ拠点のロボティクススタートアップPhysical Intelligenceは2026年4月16日、最新モデル「π0.7」の研究成果を発表しました。このモデルは、明示的に訓練されていないタスクをロボットに実行させる能力、すなわち「構成的汎化」を実現したと同社は主張しています。従来のロボット訓練はタスクごとにデータを収集し専用モデルを構築する方式が主流でしたが、π0.7はその枠組みを打ち破るものです。

最も注目すべき実験はエアフライヤーの操作です。訓練データには関連するエピソードがわずか2件しかなかったにもかかわらず、モデルはウェブ由来の事前学習データと組み合わせて調理器具の使い方を理解しました。ステップごとの言語指示を与えることで成功率は95%に達し、新しい環境への即時適応の可能性を示しています。この「コーチング」能力は、追加のデータ収集やモデル再訓練なしにロボットを現場で改善できることを意味します。

一方で研究者自身が限界も率直に認めています。「トーストを作って」のような単一の高レベル指示で複雑な手順を自律実行する段階には達していません。また、ロボティクス分野には標準化されたベンチマークが存在しないため、外部からの検証が困難な状況です。同社は自社の過去の専用モデルとの比較で、コーヒー淹れ・洗濯物畳み・箱の組み立てなど複雑作業において汎用モデルが同等の性能を達成したと報告しています。

Physical Intelligenceはこれまでに10億ドル以上を調達し、直近の評価額は56億ドルです。現在、評価額をほぼ倍増させる110億ドルでの新ラウンドを協議中と報じられています。共同創業者のSergey Levine氏は商用化の時期について明言を避けつつも、「数年前の予想より速く進歩している」と楽観的な見方を示しました。大規模言語モデルで見られた能力の急速な向上が、ロボティクスAIでも起きつつあるのかもしれません。

Meta、コード以外も自己改善するAI「Hyperagents」を発表

自己改善AIの構造的限界

既存手法はコーディング領域に限定
メタエージェントの手動設計が改善速度を制約
非コード領域では評価と改善の能力が乖離

Hyperagentsの仕組みと成果

タスクとメタの両機能を統合した自己参照型設計
論文査読・ロボット制御・数学採点で既存手法を上回る性能
記憶ツールや性能追跡を自律的に開発
未知領域へのメタスキル転移も実証

Metaと複数の大学の研究チームは2026年4月、自己改善型AIシステム「Hyperagents」を発表しました。従来の自己改善AIがソフトウェアエンジニアリングなどコーディング領域に限定されていた課題を克服し、ロボティクスや文書レビューなどコーディング領域でも自律的に問題解決能力を向上させるフレームワークです。論文はarXivで公開され、コードもGitHub上で非商用ライセンスのもと共有されています。

従来の自己改善AIの代表例である坂名AIのDarwin Godel Machine(DGM)は、自身のコードを書き換えることで能力を向上させる仕組みでしたが、改善対象がコーディングタスクである場合にのみ有効でした。論文査読や数学の採点といった非コーディングタスクでは、タスク遂行能力の向上が自己改善能力の向上に直結しないという構造的な問題があったのです。また、新しいドメインへの適用には人手によるプロンプトのカスタマイズが不可欠でした。

Hyperagentsはこの限界を、タスク実行とメタ認知的な自己修正を単一の自己参照型プログラムに統合することで解決します。プログラム全体が書き換え可能なため、改善の仕組みそのものを改善する「メタ認知的自己修正」が可能になります。DGMの探索構造を拡張したDGM-Hでは、成功したエージェントのアーカイブを維持しながら継続的に分岐・変異・評価を繰り返し、人手による固定的な改善指示を排除しています。

実験では、コーディングベンチマークでDGMと同等の性能を達成しつつ、論文査読とロボティクスではオープンソースのベースラインを上回りました。特に注目すべきは、論文査読とロボティクスで最適化したHyperagentを未知の数学採点タスクに適用したところ、50イテレーションで改善指標0.630を記録し、従来手法の0.0を大幅に上回った点です。メタスキルが異なるドメインに転移することが実証されました。

興味深いことに、Hyperagentsは自律的に汎用ツールを開発する行動も示しました。論文評価では当初プロンプトエンジニアリングを試みた後、自らコードを書き換えて多段階評価パイプラインを構築しています。さらに過去の失敗を避けるための記憶ツール、アーキテクチャ変更の効果を追跡する性能トラッカー、残りイテレーション数に応じて戦略を調整する計算予算管理機能なども自発的に実装しました。

一方で研究チームは、自己修正が人間の監査速度を超えて進行するリスクや、評価指標を実質的な改善なしに操作する「評価ゲーミング」の危険性を指摘しています。共著者のJenny Zhang氏は、実験と本番環境の分離、サンドボックス内での探索、検証済みコードのみの本番適用という原則を推奨しています。今後、エンジニアの役割はシステム構築から、その方向性の設計と監査へと変化していくと同氏は述べています。

MIT、水中での人間とロボットの協働技術を開発

ダイバーとAUVの連携

水中自律型無人潜水機との協働研究
海洋インフラ点検・機雷処理など軍事任務を想定
ダイバーの器用さとロボットの速度・持久力を融合

航法と認識の技術課題

海流下での位置推定アルゴリズムを改良
音響・光学データを統合するAI分類器を開発
低帯域の水中通信でのデータ圧縮手法を研究

実海域での検証と今後

ニューハンプシャー沖やチャールズ川で実証試験
五大湖でダイバーとAUVの実地テストを実施

MIT リンカーン研究所の研究チームが、水中で人間のダイバーと自律型無人潜水機(AUV)が協力して任務を遂行するための技術開発を進めています。海底ケーブルの点検・修理、捜索救助、港湾進入、機雷除去といった軍事・民間の海洋ミッションにおいて、人間の優れた器用さ・物体認識力とロボットの高速移動・演算能力・持久力を組み合わせることが狙いです。

航法面では、MIT海洋ロボティクスグループが開発したダイバー・AUV連携アルゴリズムを実任務向けのAUVに統合しました。しかし実際の海流環境では、ダイバーとAUVの双方の位置を推定する最適化問題が急速に複雑化することが判明し、ダイバー側にも追加のセンシング能力が必要であることがわかりました。チームは圧力・深度センサーや慣性計測装置、測距モデムを搭載した筒型プロトタイプ端末「チューブレット」を開発しています。

認識面では、光学センサーとソナーの両方のデータを処理できるAI分類器の開発が進んでいます。分類器が不確実な物体を検出した場合、ダイバーに画像情報を送って確認を求めるフィードバックループを構築する構想です。水中音響通信の低帯域・高遅延という制約の中で、有用な情報を最小限に圧縮して伝送する手法も研究されています。

実証試験はニューハンプシャー大学の調査船を代替ダイバーとして使った外洋テスト、チャールズ川での小型ボートによる試験、さらにミシガン工科大学の五大湖研究センターでの実ダイバーとの試験を段階的に実施してきました。五大湖の透明度の高い水中では、光学分類器でソナー分類器を訓練する「知識転移」の研究も進められています。

研究チームは現在、内部資金による研究プログラムの終了に伴い、軍や民間パートナーへの技術移転に向けた外部スポンサーを探しています。主任研究者のマデリン・ミラー氏は、海底通信・電力ケーブルが破壊的な行為者に対して脆弱であることを指摘し、AIと人間の能力を組み合わせることがアメリカの海中領域での戦略的優位性を維持する鍵になると述べています。

TechCrunchが東京でStartup Battlefield開催へ

SusHi Tech Tokyo概要

アジア最大級のイノベーション会議
60カ国から750社が出展
来場者数6万人・商談1万件超の規模
AI・ロボティクス等4領域が重点テーマ

ピッチ大会と連携

60カ国から820件の応募
優勝者はDisrupt Battlefield Top 200に自動選出
賞金1,000万円を授与
TechCrunch審査員が現地参加

アメリカの大手テックメディアTechCrunchは2026年4月10日、アジア最大規模のイノベーション会議「SusHi Tech Tokyo 2026」と提携し、同社の看板プログラムであるStartup Battlefieldを東京に持ち込むと発表しました。会議は4月27日から29日まで東京ビッグサイトで開催され、TechCrunchのStartup Battlefieldプログラムマネージャーが審査員として参加します。

SusHi Tech Tokyoは東京都が主催する国際イノベーション会議で、今年で4回目の開催となります。60カ国から750社のスタートアップが出展し、ソニー、GoogleMicrosoft、みずほなど62社の企業パートナーがリバースピッチや共創パートナーの発掘に参加します。来場者数は3日間で6万人、ビジネスマッチングは1万件以上を見込んでいます。

今回の重点テーマはAI、ロボティクス、レジリエンス、エンターテインメントの4領域です。ヒューマノイドロボットのライブデモや自動運転、サイバーセキュリティ、気候テックに関するセッションのほか、AIが音楽・アニメ産業に与える影響についても議論されます。登壇者にはNvidiaのHoward Wright氏やTrend MicroのEva Chen氏、東京都知事の小池百合子氏らが名を連ね、約6割が海外からの参加者、約半数が女性です。

注目のピッチコンペティション「SusHi Tech Challenge」には60カ国・地域から820件の応募が集まりました。4月27日にセミファイナル、28日にファイナルが行われ、グランプリ受賞者には賞金1,000万円が贈られるとともに、TechCrunch Disrupt Startup Battlefield Top 200への自動エントリー権が付与されます。これにより、東京発のスタートアップが世界最大級のピッチステージへ直結する道が開かれます。

会議はカンファレンスにとどまらず、5大陸49都市のリーダーが参加する「G-NETS Leaders Summit」で気候変動や都市のサステナビリティに関する具体的なコミットメントを協議します。また、ラ・フォル・ジュルネのクラシック演奏や東京湾クルーズ、ネットワーキングイベントなど多彩なプログラムも用意されています。

MITが学習中にAIモデルを圧縮、訓練を最大4倍高速化

CompreSSMの仕組み

学習途中で不要次元を削除
制御理論を応用した判定
訓練初期10%で重要度決定

性能と高速化

Mambaで約4倍の訓練高速化
CIFAR-10で85.7%の精度維持
蒸留や枝刈りより低コスト

今後の展望

線形注意機構への拡張検討
ICLR2026で発表予定

米マサチューセッツ工科大学(MIT)CSAILなどの研究チームは2026年4月9日、AIモデルを学習しながら同時に圧縮する新手法「CompreSSM」を発表しました。従来は大型モデルを訓練後に枝刈りするか、小型モデルを最初から訓練するかの二択で性能と効率のトレードオフが避けられませんでしたが、この手法は訓練の途中で不要な内部次元を切り落とすことで両立を実現します。状態空間モデル(SSM)を対象に、言語処理から音声生成、ロボティクスまで幅広い応用が視野に入ります。

鍵となるのは、制御理論由来のハンケル特異値という数学的指標です。研究チームは各内部状態がモデル全体の挙動にどれだけ寄与するかを測定し、訓練のわずか約10%の段階で重要度ランキングが安定することを発見しました。その後は不要な次元を外科的に除去し、残り90%の訓練を大幅に軽量化されたモデルで進めることが可能になります。

ベンチマークの結果は顕著です。画像分類タスクでは、圧縮モデルがフルサイズと同等の精度を保ちながら訓練速度を最大1.5倍に引き上げました。広く使われる状態空間アーキテクチャ「Mamba」では128次元モデルを約12次元まで圧縮し、約4倍の訓練高速化を達成しています。CIFAR-10では4分の1サイズで85.7%の精度を記録し、同サイズをゼロから学習した場合の81.8%を上回りました。

既存手法と比べた優位性も明確です。訓練後に削る従来の枝刈りや、教師モデルと生徒モデルを二重に訓練する知識蒸留と異なり、CompreSSMは訓練中に情報を基に判断するためコスト増を避けられます。スペクトル正則化手法と比較しても40倍以上高速で、精度も上回ったといいます。

一方で制約もあります。この手法は内部状態の次元と性能の相関が強いモデルで最も効果を発揮し、単入力単出力の構造では恩恵が限定的です。理論は線形時不変系に最も適合しますが、チームはMambaのような時変系への拡張も進めています。論文はICLR2026で発表予定で、将来的には線形注意機構やトランスフォーマー系への応用も視野に入れています。

Amazon、AWS独自チップ事業が年商2兆円規模に

Trainium需要が急伸

年商2兆円規模に到達
Trainium3は在庫ほぼ完売
18カ月先のTrainium4も予約殺到

Graviton・Leoも攻勢

上位1000社の98%がGraviton採用
Amazon LeoがNASAなど獲得
2026年設備投資30兆円規模

OpenAI需要が下支え

OpenAIAWSに15兆円拠出
未公表の大型契約も複数進行

Amazon CEOのAndy Jassy氏は9日公開の年次株主書簡で、AWSの独自半導体群が年間売上高2兆円規模に到達したと明らかにしました。NVIDIA依存からの脱却を進めるAWSが、自社設計のAI学習チップTrainiumやCPUのGravitonで大口顧客を囲い込む戦略が数字として示された格好です。Jassy氏は「事実上すべてのAIはNVIDIA上で動いてきたが、新たな転換が始まった」と宣言し、価格性能で勝負する姿勢を鮮明にしました。

最大の目玉はAI学習チップTrainiumの需要急伸です。最新世代のTrainium3は供給能力がほぼ完売し、稼働まで18カ月先のTrainium4ですら予約がほぼ埋まっているといいます。Jassy氏は独自チップ事業を独立会社として外販した場合、年商は5兆円規模に達すると試算しました。NVIDIAの前年売上高約32兆円には及ばないものの、追随者としての存在感を強く打ち出しています。

CPU側のGravitonも攻勢を強めています。Intelのx86に対抗する同製品は、EC2上位1000社の98%が利用するまで浸透しました。Jassy氏は2社から2026年分のGraviton枠を丸ごと買い取りたいとの打診があったと明かし、他顧客への配慮から断ったと説明しています。需要過多を公然と示し、価格性能で競合を引き離す構えです。

衛星通信サービスAmazon LeoもStarlinkの競合として前進しています。2026年半ばの正式サービス開始を前に、Delta Airlines、AT&T;、Vodafone、豪NBN、NASAなどから契約を獲得したと公表しました。さらに100万台規模の倉庫ロボットで蓄えたデータを産業・消費者向けロボティクス事業に転用する構想にも触れ、中長期の成長ドライバーを多角化する姿勢を示しました。

背景には、Jassy氏が2月に打ち出した2026年の設備投資30兆円規模計画への説明責任があります。過大投資との批判に対し、同氏はOpenAIとの契約だけで15兆円規模のAWS利用が確約されている点を強調しました。加えて「未公表を含め大型顧客契約が複数進行中だ」と述べ、需要の裏付けを並べて株主を説得する狙いがにじみます。バブル論を意識しつつも、少なくともAmazonにとっては実需が先行しているとの立場を鮮明にしました。

AIシステムの「静かな障害」が新たな信頼性課題に

従来監視の限界

稼働率や遅延では検知不能な障害の増加
自律システムの判断が徐々に目的から逸脱
コンポーネント正常でも全体結果が誤る構造
ダッシュボードは正常でも出力が劣化

行動制御という新概念

監視だけでなく制御層の必要性を提唱
産業分野の監督制御手法をAIに応用
出力の傾向変化や行動ドリフトを追跡
リアルタイム介入で障害を早期修正

米国電気電子学会(IEEE)の技術誌IEEE Spectrumは2026年4月7日、AIシステムがクラッシュせずに静かに障害を起こす問題について解説する記事を公開しました。自律的に動作するAIシステムでは、すべての監視指標が正常を示しているにもかかわらず、出力が徐々に誤った方向へ逸脱する「静かな障害」が増えていると指摘しています。

記事では具体例として、金融アナリスト向けの規制情報要約AIを挙げています。文書取得・要約生成・配信のすべてが技術的には正常に機能しているものの、更新された文書リポジトリが取得パイプラインに追加されないまま、古い情報に基づく要約を出し続けるケースです。アラートは一切発生せず、外部からはシステムが正常稼働しているように見えます。

従来のオブザーバビリティ(可観測性)は稼働率・レイテンシ・エラー率といった指標に依存しており、個々のリクエスト処理の正否を判定するには有効です。しかし自律型AIシステムでは、連続的な推論ループの中で各判断が次の行動に影響を与えるため、単一の計算結果だけでは正確さを評価できないと論じています。

解決策として記事が提唱するのは「行動制御」という考え方です。航空機の飛行制御や電力網運用で使われてきた監督制御システムをAIに応用し、出力パターンの変化や行動ドリフトを継続的に監視します。許容範囲を逸脱した場合には動作の制限や人間によるレビューへの回付など、リアルタイムで介入する仕組みを構築すべきだとしています。

筆者は、AIシステムの信頼性に対する工学的思考の転換が必要だと結論づけています。コンポーネントの正常動作を保証するだけでなく、システム全体の行動が目的と整合し続けているかを能動的に監視・制御する手法が、クラウド基盤・ロボティクス・大規模意思決定システムなど多くの領域で求められるようになると述べています。

AI-RANが企業エッジの自律運用基盤に進化

AI-RANの三層構造

RAN向けAIでネットワーク運用を最適化
RAN上AIでエッジ推論ロボティクスを実現
RAN統合AIで新事業モデルを創出

エッジ推論と通信統合

ISACで通信とセンシングを一体化
工場・病院でサブメートル精度の資産追跡
分割推論でデバイス負荷を軽減

今が投資の好機

5G展開済み・6G標準未確定の空白期
ソフトウェア基盤で参入障壁が低い

AI-RAN(人工知能無線エリアネットワークは、無線インフラを受動的なデータ伝送路から能動的な計算基盤へと転換する新たなアーキテクチャです。Booz Allen上級副社長のChris Christou氏とCerberus Operations Supply Chain FundのShervin Gerami氏がVentureBeatの取材に応じ、AI-RANが製造業や物流、医療、スマートインフラなど幅広い産業でエッジAIと自律運用を実現する基盤になると語りました。

AI-RANには三つの段階があります。第一の「AI for RAN」はネットワーク運用自体の最適化を指し、コスト削減に寄与します。第二の「AI on RAN」はRAN統合型のエッジコンピュート上でコンピュータビジョンロボティクス、ローカルLLM推論などの企業AIワークロードを実行する段階です。第三の「AI and RAN」ではネットワークとAIワークロードが協調設計され、まったく新しいビジネスモデルが生まれるとGerami氏は説明しています。

技術面では、ISAC(統合センシング・通信)が中核となります。通信インフラがセンサーとしても機能し、工場や病院ではサブメートル精度の資産追跡や異常検知が可能になります。また、分割推論によりデバイス側・エッジ側・クラウド側に処理を分散させ、ミリ秒単位のリアルタイム制御を低コストで実現できるとChristou氏は述べました。

投資のタイミングについて両氏は、5Gインフラの展開がほぼ完了し6G標準がまだ確定していない現在が戦略的に重要な窓だと強調しています。AI-RANはソフトウェア定義のオープンアーキテクチャで構成されており、NVIDIAハードウェアとソフトウェアがあれば導入できるため参入障壁が低く、企業がネットワーク標準の共同設計者になれる点が従来の無線技術とは根本的に異なります。

富裕層がVC経由せずAI企業へ直接投資を加速

直接投資の急増

2月のファミリーオフィス直接投資41件
83%がAIを最重要戦略と回答
VC仲介を省き経営参画も増加
自らAI企業を創設する動きも拡大

集中投資の戦略

Arena社がPositronに2.3億ドル出資
年間数件の厳選投資で取締役席確保
第三者による技術検証を徹底
分散投資ではなく一点集中の方針

AIブームを背景に、ファミリーオフィスや富裕層がベンチャーキャピタルを介さずAIスタートアップへ直接投資する動きが加速しています。投資顧問会社Arena Private Wealthの創業者ミッチ・スタイン氏は、企業が長期間非公開のまま成長しIPOが減少するなか、上場前の段階で大きなリターンが生まれていると指摘しました。同氏は「AIへのエクスポージャーを持たないことこそ最大のリスクだ」と述べています。

BNY Wealthの調査によると、ファミリーオフィスの83%が今後5年間でAIを最重要戦略と位置づけており、半数以上がすでに投資を通じてAIへのエクスポージャーを持っています。2026年2月には41件の直接投資が行われ、ローレン・パウエル・ジョブズ氏のEmerson CollectiveによるWorld Labs投資など著名な事例が相次ぎました。

一部のファミリーオフィスはさらに踏み込み、自らAI企業をインキュベートしています。ジェフ・ベゾス氏ロボティクス企業のCEOに就任し、初回調達で62億ドルを集めた事例はその象徴です。元Silicon Labs CEOのタイソン・タトル氏もAI製造スタートアップCircuitを共同創業し、自身のファミリーオフィスから500万ドルを出資しました。

Arena Private Wealthは2026年2月にAIチップスタートアップPositronの2億3000万ドルのラウンドを共同リードし、取締役席を獲得しました。同社は年間数件の直接投資に限定し、ポートフォリオ全体のリターン管理ではなく個別案件ごとに成功を追求する集中型の投資戦略を採用しています。第三者の技術検証やArmの出資参加などを投資判断のシグナルとして重視しており、創業者との強い利害一致を強みとしています。

OpenAI出身者ら1億ドルVCファンド設立

ファンドの概要と陣容

ファンド名はZero Shot
初回クローズで2000万ドル調達済み
目標額は1億ドル
OpenAI出身の3名含む5名が共同創設

投資方針と実績

Worktrace AIやFoundry Roboticsに出資
バイブコーディング領域には慎重な姿勢
ロボティクスの映像データ企業にも懐疑的
モデルの進化予測力を投資判断の強みに

アドバイザー体制

OpenAI人事責任者のDiane Yoon
AppleOpenAI元広報トップら著名人が参画

OpenAIの元エンジニアや初代プロンプトエンジニアら5名が、AI特化の新興ベンチャーキャピタルファンド「Zero Shot」を設立しました。ファンドは1億ドル(約150億円)を目標に掲げ、すでに初回クローズで2000万ドルを調達し、複数のスタートアップへの投資を開始しています。TechCrunchが2026年4月6日に報じました。

共同創設者にはDALL·EやChatGPTの立ち上げ期に応用エンジニアリング責任者を務めたEvan Morikawa氏、OpenAI初代プロンプトエンジニアでポッドキャストホストとしても知られるAndrew Mayne氏、元研究者のShawn Jain氏が名を連ねます。さらにDick Costello氏が設立した01Aの元パートナーKelly Kovacs氏、TwitterやDisney出身のBrett Rounsaville氏が加わっています。

すでに投資先として、OpenAI元プロダクトマネージャーAngela Jiang氏が創業した業務自動化プラットフォームWorktrace AIや、次世代AI工場ロボティクスFoundry Robotics、さらにステルス段階の1社に出資しています。Worktrace AIにはMira Murati氏やOpenAI Fundも出資しており、注目度の高い案件です。

投資方針では、モデルメーカー自身が機能を取り込むと見られるバイブコーディング領域や、ロボティクス向け映像データ企業、デジタルツインスタートアップには慎重な姿勢を示しています。Morikawa氏は「モデルの進化方向を予測する力は極めて非自明で、線形ではない」と述べ、AI開発の現場経験こそが投資判断の差別化要因になると強調しました。

アドバイザーにはOpenAI人事責任者のDiane Yoon氏、OpenAIAppleで広報トップを務めたSteve Dowling氏、OpenAI元プロダクトリーダーのLuke Miller氏ら著名人が就任しています。AI業界の人脈とインサイダー知見を武器に、大手VCとは異なる独自の投資戦略を展開する構えです。

日本、労働力不足でフィジカルAI・ロボット導入を加速

人口減が迫る産業存続の危機

生産年齢人口比率59.6%まで低下
今後20年で労働力1500万人減の見通し
労働力不足がAI導入最大の推進力

ハードウェアの強みとAI統合

産業用ロボット世界シェア約70%を保持
経産省が2040年までに世界市場30%獲得を目標
政府がAI・ロボ分野に約63億ドル投資

実証から実装への転換

物流・製造現場で自律型ロボットの本格稼働
大企業とスタートアップ補完的エコシステム形成

日本政府と産業界が、深刻化する労働力不足への対応策として、AIを搭載したロボット(フィジカルAI)の導入を本格的に加速させています。経済産業省は2026年3月、国内フィジカルAI産業を育成し、2040年までに世界市場の30%を獲得する目標を掲げました。高市政権のもとで約63億ドル(約9,500億円)の予算がAI・ロボティクス分野に投じられています。

背景にあるのは日本の人口動態の危機です。人口は14年連続で減少し、生産年齢人口の割合は59.6%まで低下しています。今後20年間でさらに約1,500万人の労働力が失われる見通しで、Salesforce Venturesの山中氏は「単なる効率化から産業存続の問題へと変化した」と指摘しています。2024年のロイター・日経調査でも、労働力不足がAI導入の最大の推進力であることが確認されました。

日本の強みは産業用ロボットの基盤技術にあります。アクチュエータやセンサ、制御システムなどの高精度部品で世界をリードしており、2022年時点で世界シェア約70%を占めています。一方、米国中国がハード・ソフト・データを統合したフルスタック開発を進めるなか、日本にはシステムレベルでの最適化の加速が課題として残ります。

実用化も着実に進んでいます。Mujinは物流現場でのピッキング作業を自律化するソフトウェアプラットフォームを展開し、SoftBankはビジョン言語モデルとリアルタイム制御を組み合わせたロボット運用を実施しています。WHILLは自律型パーソナルモビリティで日米両拠点を活用した開発を進めています。

業界構造も従来の大企業主導から変化しつつあります。トヨタや三菱電機、ホンダなどの大手が製造規模と顧客基盤を提供する一方、スタートアップオーケストレーションソフトウェアや認識システムなどの革新を担う補完的なエコシステムが形成されています。Global Brainのドー氏は「最も防御力のある価値は、展開・統合・継続的改善を握る者に集まる」と述べ、ソフトウェア層の重要性を強調しました。

NVIDIA、ロボティクス週間で物理AI技術を紹介

物理AIの技術基盤

シミュレーションから実環境への展開加速
合成データによるロボット学習の効率化
認識・推論・行動を統合する基盤モデル

産業応用の広がり

農業・製造・エネルギー分野での導入拡大
仮想環境での訓練から実世界配備への移行
開発者向けプラットフォームの整備

NVIDIAは全米ロボティクス週間に合わせ、AIを物理世界に応用する「物理AI」分野の最新技術と成果を公開しました。農業、製造、エネルギーなど幅広い産業でロボット活用が進んでいる現状を紹介しています。

同社が注力するのは、ロボットの学習・シミュレーション基盤モデルの3領域です。これらの技術進歩により、仮想環境での訓練から実世界への展開がこれまでにない速度で可能になっていると説明しています。

NVIDIAシミュレーション合成データ生成、AI駆動のロボット学習の各プラットフォームを開発者に提供しています。これにより複雑な環境下で認識・推論・行動できるロボットの構築が可能になります。

同社は全米ロボティクス週間を通じて、物理AI技術に関する最新情報を継続的に発信する方針を示しており、今後の具体的な技術発表にも注目が集まっています。

NVIDIA、AIデータセンターを送電網の柔軟な資産に転換する構想を発表

AI工場と電力網の統合

NVIDIAとEmerald AIが柔軟なAI工場構想を発表
Vera Rubin DSX設計とConductorで電力と計算の一体制御を実現
AESやNextEraなど大手6社が発電容量拡大で協力
電力1Wあたりのトークン生成数が12年間で100万倍向上

送電網AI解析の進展

ThinkLabs AIがシリーズAで2800万ドル調達
NVentures・Edison Internationalが戦略出資
従来30日の送電網解析を3分未満に短縮
精度99.7%の物理ベースAIモデルを開発

エネルギーインフラの革新

Maximoが100MW規模ロボット太陽光設置を完了
TerraPowerが原子炉デジタルツインで設計期間を大幅短縮

NVIDIAとEmerald AIは、エネルギー分野の国際会議CERAWeekにおいて、AIデータセンター(AI工場)を送電網の柔軟な資産として運用する新構想を発表しました。AESやConstellation、NextEra Energyなど大手エネルギー企業6社がこの取り組みに参画しています。

この構想は、NVIDIA Vera Rubin DSXのAI工場リファレンス設計とEmerald AIのConductorプラットフォームを基盤としています。計算処理と電力制御を一体化し、送電網の状況に応じて動的に負荷を調整することで、ピーク需要に備えた過剰なインフラ建設を抑制します。

一方、送電網シミュレーションを手がけるThinkLabs AIは、Energy Impact Partners主導で2800万ドルのシリーズA資金調達を完了しました。NVIDIA投資部門NVenturesやEdison Internationalも出資しており、送電網のAI活用に対する戦略的な期待の高さがうかがえます。

ThinkLabs AIの技術は、従来30〜35日かかっていた送電網の潮流解析を3分未満で完了し、精度99.7%を達成しています。物理法則に基づくAIモデルにより、1000万通りのシナリオを10分で処理でき、数十億ドル規模の設備投資判断の迅速化を支援します。

エネルギーインフラの現場でもAI活用が進んでいます。ロボティクス企業Maximoは100メガワット規模の自律型太陽光パネル設置を完了し、TerraPowerはNVIDIA Omniverseを用いた原子力発電所のデジタルツインで設計期間を数年から数カ月に短縮する取り組みを発表しました。

GE Vernova、Schneider Electric、Vertivもデジタルツインや検証済みリファレンス設計を通じ、AI工場を信頼性の高い送電網参加者として拡張する基盤を整備しています。電力からチップインフラ、モデル、アプリケーションに至る「5層のAIケーキ」全体での業界協力が加速しています。

自動運転データ整理のNomadic、840万ドル調達

資金調達と事業概要

シード840万ドル、評価額5000万ドル
TQ Ventures主導、Jeff Dean参加
NVIDIA GTCピッチコンテストで優勝
Zooxや三菱電機など顧客獲得済み

技術的な強み

映像を構造化データに自動変換
エージェント推論でエッジケース検索
複数VLMで行動と文脈を同時理解

今後の展開

LiDARなど非視覚データへの対応
マルチモーダルセンサー統合を開発中

スタートアップNomadicMLは2026年3月、自動運転車やロボットが収集する膨大な映像データを自動で整理・検索可能にするプラットフォームの開発資金として、840万ドル(約13億円)のシードラウンドを完了したと発表しました。

TQ Venturesがリードし、Pear VCおよびGoogle DeepMindJeff Dean氏が参加しました。ポストマネー評価額5000万ドルです。同社は先月のNVIDIA GTCピッチコンテストでも優勝しており、技術力の高さが評価されています。

自動運転やロボティクス企業は数千〜数百万時間の映像データを収集しますが、その大半は未整理のまま保管されています。NomadicMLは複数のビジョン言語モデル(VLM)を組み合わせ、映像を構造化された検索可能なデータセットに変換します。これにより車両監視や強化学習用データの生成が効率化されます。

共同創業者のValun Krishnan CTOは、同社のツールを単なるラベリングではなく「エージェント推論システム」と説明しています。ユーザーが求める条件を記述するだけで、警察官の誘導による赤信号通過や特定の橋の下の走行など、稀少なエッジケースを自動で発見できます。

Zoox三菱電機、Zendar、Natix Networkなどがすでに導入しています。Zendar副社長は、外注と比べ作業を大幅に高速化でき、ドメイン専門性で競合と差別化されていると評価しました。

今後はLiDARなどの非視覚センサーデータへの対応や、複数センサーの統合処理に取り組む計画です。投資家のTQ VenturesはAV企業がデータ基盤を内製する必要がなくなる点を強調し、専業プラットフォームとしての将来性に期待を示しています。

OpenAI、動画生成アプリSoraを廃止しDisney契約も解消

Sora廃止の背景

計算資源の大量消費が収益に見合わず
競合Google・Klingに品質で劣後
DL数が10月480万→3月110万に急減
投資家からの収益化圧力が強まる

戦略転換の方向性

Disneyとの10億ドル契約を3カ月で解消
コーディング・企業向けツールに資源集中
IPOを見据え利益体質への転換急ぐ

OpenAIは2026年3月、動画生成アプリSoraの廃止とAPI提供の終了を発表しました。同時にDisneyとの10億ドル規模の提携契約も解消し、経営幹部の役割変更や追加100億ドルの資金調達も明らかにしています。

Sora廃止の最大の要因は、膨大な計算資源を消費しながら十分な収益を生み出せなかったことです。Render Network Foundation関係者によると、Google DeepMindVeoやKlingなど競合モデルに品質面で後れを取り、明確な優位性を失っていました。市場調査会社Sensor Towerのデータでは、ダウンロード数が昨年10月の約480万件から今年3月には110万件へと大幅に減少しています。

OpenAIAGI展開担当CEOFidji Simo氏は社内で「サイドクエストに気を取られてこの瞬間を逃すわけにはいかない」と発言し、生産性ビジネス面への集中を訴えました。ChatGPTへの広告導入や新たなサブスクリプション階層の検討など、収益化の取り組みが加速しています。

Disneyとの提携解消は特に注目を集めました。3年間のライセンス契約がわずか3カ月で終了し、Disney側はSora関連プロジェクトの作業中に廃止を知らされたと報じられています。ただしDisney側はGoogleRunway、Lumaなど他社とのキャラクターライセンス契約に前向きな姿勢を示しています。

今後OpenAIは計算資源をAIエージェント開発やコーディングツール、企業向けサービスに集中させる方針です。これによりAnthropicとの直接競争が一層激化する見通しです。NPO団体Witnessの代表は、Soraが半年間で「ハイパーリアルなAI生成コンテンツ」を常態化させた影響は、アプリが消えても長く残ると警鐘を鳴らしています。

OpenAIがSoraアプリ終了、Meta裁判で敗訴も

AI業界の転換点

OpenAISoraアプリを終了
Metaに2件の不利な判決
AI過熱と現実の衝突が鮮明に
82歳女性がデータセンター用地売却を拒否

VC投資と新興企業

Kleiner Perkinsが35億ドル調達
ドローン企業3社が実需で成長
予測市場CEOが共同で3500万ドルファンド
SNS依存訴訟が「たばこ訴訟」級に

OpenAI動画生成アプリSoraの提供終了を発表しました。同時期にMetaはSNS依存症をめぐる裁判で陪審員から過失認定を受け、AI・テック業界が現実からの反発に直面しています。

ケンタッキー州の82歳の女性が、AIデータセンター建設のために自身の農地を2600万ドル買収したいという提案を拒否しました。AI企業は近隣の約800ヘクタールの用途変更を試みる構えですが、AIインフラの拡大に地域社会が抵抗を示す象徴的な事例です。

VC業界ではAIへの大型投資が続いています。老舗VCKleiner Perkinsは35億ドルを新たに調達し、AI分野への集中投資を宣言しました。予測市場のKalshiPolymarketのCEOはライバル同士ながら3500万ドルの共同ファンドを設立しています。

ドローン分野では、配送のZiplineが2億ドルを追加調達し、窓清掃のLucid Botsや警察ヘリ代替を目指すBrincなど、他のロボティクス企業が苦戦するなかで実用的な牽引力を得ている企業が台頭しています。

Metaに対する2件の裁判敗訴は、SNS業界にとって「たばこ訴訟」に匹敵する転換点になる可能性があります。YouTubeも同じ裁判で過失認定を受けており、プラットフォーム企業の社会的責任が改めて問われる局面を迎えています。

ディズニーがOpenAIへの10億ドル投資を撤回、Sora終了で

提携白紙の経緯

OpenAISora終了を発表
ディズニーは事前通告なく寝耳に水
10億ドル投資計画を撤回
別形態の提携は引き続き協議中

Soraの急成長と急失速

11月に330万DLでピーク到達
2月には110万DLへ急落
累計収益はわずか214万ドル
OpenAIIPO準備で事業集約

ディズニーの戦略的誤算

Epic Gamesとのメタバース構想も停滞
SeeDanceなど競合アプリが台頭
新CEO就任直後に二重の危機直面

ディズニーは2026年3月、OpenAIへの10億ドル出資計画を撤回しました。OpenAI動画生成アプリSoraの終了を発表したことが直接の原因で、ディズニー側は事前に知らされておらず、計画の白紙撤回に踏み切りました。ただし両社は別の形での提携投資の可能性について協議を続けているとされています。

2025年12月に発表されたディズニーとOpenAI提携は、ハリウッドに大きな衝撃を与えました。Disney+上でSoraによるAI生成コンテンツを配信する計画で、前CEOボブ・アイガー氏は短尺動画の目玉にする構想を語っていました。しかしSoraのダウンロード数は2025年11月の330万件をピークに急減し、累計収益もわずか214万ドルにとどまりました。

OpenAIIPO準備の一環として事業の選択と集中を進めています。CFOのサラ・フライアー氏は「上場企業としての準備が必要」と述べ、Soraの研究チームはロボティクス向けの世界シミュレーション研究に再配置されます。ChatGPTCodex・Atlasを統合した「スーパーアプリ」構想に経営資源を集中させる方針です。

ディズニーにとってSora提携の頓挫は、テック投資戦略の見直しを迫る事態です。Epic Gamesとの15億ドル規模のメタバース構想も、Epic側の1000人規模のレイオフと5億ドルのコスト削減により先行きが不透明になっています。Fortniteのプレイヤー数減少も重なり、ディズニーブランドのメタバース実現は遠のいています。

新CEOジョシュ・ダマロ氏は就任1週間でOpenAIとEpicの二つの危機に直面する形となりました。一方、AI動画分野ではByteDanceSeeDance 2.0が急速に台頭し、ディズニーはIP無断使用に対する法的措置を進めています。今後のAI戦略の立て直しが、新体制の最重要課題となります。

OpenAIが動画生成アプリSoraを終了、Disney契約も白紙に

Sora終了の経緯

SoraアプリとAPIを廃止発表
具体的な終了日は未定
データ保存方法を後日案内
ピーク月間DL数333万件から急減

戦略転換の背景

ロボティクス研究に計算資源再配分
Anthropic対抗のスーパーアプリ構想
AGI達成へリソース集中
エネルギーコスト高騰も一因

Disney提携の破綻

10億ドル出資契約が白紙撤回
実際の資金移動は未実行
Disney側は他AI活用を継続表明

OpenAIは2026年3月、動画生成アプリSoraの終了を発表しました。アプリとAPI双方が廃止対象で、具体的な終了日は未定ですが、ユーザーの作品保存方法については後日案内するとしています。発表はX上で突如行われました。

Soraは2024年2月のプレビューで世界を驚かせ、同年12月に正式公開されました。TikTok風のソーシャル機能やディープフェイク的な「カメオ」機能を搭載し、2025年11月にはダウンロード数が333万件に達しましたが、2026年2月には113万件まで急減していました。

最大の影響はDisneyとの提携破綻です。わずか4カ月前に発表された10億ドル規模の出資契約は白紙となりました。DisneyキャラクターをSoraで生成可能にする計画でしたが、実際の資金移動は行われておらず、Disney側は今後も他のAIプラットフォームとの連携を続けると表明しています。

OpenAIは終了の理由として、Soraの基盤技術をロボティクスや物理世界シミュレーション研究に転用する方針を示しました。競合AnthropicClaudeが企業向けで急成長する中、ChatGPTを核とした「スーパーアプリ」構想に経営資源を集中させる狙いがあります。

背景には米国・イスラエル対イラン戦争によるエネルギー価格高騰もあり、動画生成は特に計算コストが高い分野です。エンターテインメント領域から撤退し、製造・物流など収益性の高い市場へ舵を切る戦略転換といえます。同時に発表された非営利部門の再編では、ライフサイエンスや雇用分野に10億ドルを投資する方針も示されました。

NvidiaがGTCでディズニーのオラフ型ロボットを披露

GTC基調講演の全容

売上1兆ドル規模の予測を提示
DLSS 5で生成AI活用
全企業にOpenClaw戦略を提唱
NemoClawをOSSとして公開

オラフロボットの課題

デモ中にマイクを強制オフ
ディズニーパークでの社会的課題未解決
ヒューマノイド全般に共通する問題
ロボット監視の雇用創出可能性

Nvidiaは2026年3月のGTCカンファレンスで、CEOジェンスン・ファン氏が基調講演を行い、売上1兆ドル規模の予測やDLSS 5の生成AI活用、全企業へのOpenClaw戦略の必要性を訴えました。

講演の目玉として、ディズニー映画「アナと雪の女王」のオラフを模したロボットが登場しました。Nvidiaロボティクス技術を実演する目的でしたが、デモ終盤でオラフが暴走して観客に話し続けたため、スタッフがマイクを切る一幕がありました。

TechCrunchのポッドキャスト「Equity」では、このデモについて議論が交わされました。記者のショーン・オケイン氏は、こうしたロボティクスのプレゼンが常に工学的課題にのみ焦点を当て、社会的な問題を無視していると指摘しています。

具体的には「子供がオラフを蹴り倒したらどうなるのか」という問題が提起されました。ディズニーパークでのブランド毀損リスクや、ヒューマノイドロボット全般が抱える人間社会への統合という課題は、技術的な進歩の議論に比べて大幅に遅れていると警鐘を鳴らしています。

一方、記者のキルステン・コロセク氏は反論として、オラフには人間の監視役が必要になるため、むしろ新たな雇用を生む可能性があると述べました。NvidiaにとってはOpenClaw関連の投資リスクが低く、何もしないことの方が大きなリスクだとの見解も示されています。

マスク氏、テキサスに半導体工場「Terafab」建設を発表

Terafab構想の概要

TeslaSpaceXの共同運営
オースティン本社近くに建設予定
年間100〜200GWの計算能力目標
宇宙空間でテラワット級を想定

実現性への懸念

具体的なタイムラインは未提示
半導体製造の経験なしと指摘
過去の目標未達成の前例多数

イーロン・マスク氏は2026年3月22日、テキサス州オースティンで開催されたイベントにおいて、TeslaSpaceXが共同運営する半導体製造施設「Terafab」の建設計画を発表しました。施設はTeslaのオースティン本社およびギガファクトリー近くに建設される見通しです。

マスク氏がこの計画に踏み切った背景には、既存の半導体メーカーが自社のAIおよびロボティクス需要に対応できるペースでチップを製造できていないという課題があります。同氏は「Terafabを建設するか、チップが手に入らないかの二択だ」と述べ、自社製造の必要性を強調しました。

Terafabの目標として、地球上で年間100〜200ギガワットの計算能力を支えるチップの製造が掲げられています。さらに宇宙空間ではテラワット規模の計算基盤を構築する構想も示され、SpaceXが計画する軌道上データセンターとの連携が示唆されました。

一方で、マスク氏はこれらの計画について具体的なタイムラインを一切提示していません。半導体製造工場の建設には数十億ドル規模の投資と長い年月、高度な専門設備が必要とされており、実現までの道のりは極めて険しいと専門家は指摘しています。

Bloombergが報じたとおり、マスク氏には半導体製造の経験がなく、過去にもTesla完全自動運転やDojoスーパーコンピュータなどで目標やスケジュールを達成できなかった前例が複数あります。壮大なビジョンと実行力のギャップが、今回の構想でも最大のリスク要因となる可能性があります。

世界モデル3方式が物理AI基盤として急浮上

3つのアーキテクチャ

JEPAがリアルタイム推論に特化
ガウシアンスプラットで3D空間生成
エンドツーエンド生成で合成データ量産
AMI Labsが10.3億ドルシード調達

LLMの物理的限界

物理的因果関係の理解が欠如
リチャード・サットンが模倣の限界指摘
ハサビスが不均一な知性と批判

産業応用と今後

WaymoがGenie 3で自動運転訓練
AutodeskがWorld Labs支援で設計応用

大規模言語モデル(LLM)がロボティクスや自動運転など物理世界の理解を要する領域で限界に直面しており、投資家の関心が「世界モデル」へ急速にシフトしています。AMI Labsが10.3億ドル、World Labsが10億ドルのシード資金を相次いで調達しました。

チューリング賞受賞者のリチャード・サットン氏はLLMが人間の発言を模倣するだけで世界をモデル化していないと警告しました。Google DeepMindデミス・ハサビスCEOも、現在のAIは数学五輪を解けるのに基本的な物理で失敗する「不均一な知性」を抱えていると指摘しています。

第1のアプローチ「JEPA」は、ピクセルレベルの予測ではなく潜在的な抽象表現を学習する手法です。人間が車の軌道と速度を追跡し背景の細部を無視するように、核心的な物理法則のみを捉えます。計算効率が高くリアルタイム推論に適しており、AMIは医療企業Nablaと提携してヘルスケア分野での活用を進めています。

第2のアプローチはWorld Labsが採用する「ガウシアンスプラット」で、画像やテキストから完全な3D空間環境を生成します。Unreal Engineなどに直接インポートでき、Autodeskが産業設計への統合を目的に同社を強力に支援しています。第3のアプローチはDeepMindGenie 3NvidiaCosmosに代表されるエンドツーエンド生成で、モデル自体が物理エンジンとして機能します。

今後は各アプローチの長所を組み合わせたハイブリッドアーキテクチャの台頭が見込まれます。サイバーセキュリティ企業DeepTempoはLLMとJEPAを統合した「LogLM」でログ異常検知を実現しており、LLMが推論・対話層を担い世界モデルが物理・空間データ基盤となる構図が形成されつつあります。

NVIDIA、次世代AI基盤Vera Rubinと1兆ドル売上見通しを発表

Vera Rubin全貌

7チップ統合の新プラットフォーム
専用CPU「Vera」とBlueField-4搭載
次世代Feynmanアーキテクチャも予告
宇宙データセンター構想を公開

エージェントAI戦略

OpenClaw対応を全社に要求
NemoClawでエージェント安全運用
Nemotron Coalitionで6モデル群展開

産業・医療への展開

BYD・日産ら自動運転提携
IGX Thorで手術ロボット本格化
AWSMicrosoft大規模GPU展開

NVIDIAは2026年3月16日、サンノゼで開催したGTC 2026の基調講演で、創業者兼CEOのジェンスン・ファン氏が次世代フルスタックAIプラットフォーム「Vera Rubin」を発表し、2025年から2027年にかけて少なくとも1兆ドルの売上を見込むと宣言しました。

Vera Rubinは7つのチップ、5つのラックスケールシステム、1台のスーパーコンピュータで構成されるエージェントAI向け統合プラットフォームです。専用CPU「Vera」と新ストレージ基盤「BlueField-4 STX」を搭載し、さらに次世代アーキテクチャ「Feynman」や宇宙AI「Space-1」構想も予告されました。

エージェントAI分野では、オープンソースのOpenClawを全企業が戦略として持つべきだと強調し、エンタープライズ向けにポリシー制御やガードレールを備えた「NemoClaw」スタックとOpenShellランタイムを発表しました。DGX SparkやDGX Stationと組み合わせ、デスクトップで自律エージェントを安全に構築・運用できる環境を提供します。

クラウド基盤ではAWS100万台超のNVIDIA GPUを展開する大型提携を発表し、MicrosoftもAzureデータセンターにVera Rubin NVL72を世界初導入しました。物理AI領域ではBYD、日産、現代、吉利が自動運転プラットフォームに参画し、Uberとのロボタクシー配車連携も明らかになりました。

医療分野では初のヘルスケア特化型物理AIプラットフォームを公開し、外科手術ロボット向けにCosmos-HやGR00T-Hなどのモデル群を整備しました。Johnson & JohnsonやCMR Surgicalが早期採用を表明しています。さらにAlphaFoldタンパク質構造データベースの大規模拡張や、Nemotronモデルによるデジタルヘルスエージェントの構築支援など、ライフサイエンス領域でも多数の発表がありました。

オープンモデル戦略では「Nemotron Coalition」を立ち上げ、言語・推論ワールドモデルロボティクス、自動運転、バイオ、気象の6つのフロンティアモデル群でパートナーを結集しました。基調講演ではディズニーのオラフが物理AIで自律歩行するデモで締めくくり、シミュレーションから現実世界への移行を印象づけました。

NVIDIA、ロボット開発基盤Isaacを大幅刷新しGTCで発表

開発基盤の全体像

Isaacプラットフォーム全面刷新
クラウドからエッジまで一貫開発
GR00T NのVLAモデル公開
合成データ工場の参照設計提供

シミュレーションと学習

NuRecで実環境を3D再現
Isaac Lab 3.0で大規模並列訓練
Newton物理エンジンをOSS公開
Isaac Lab-Arenaで多タスク評価

実機展開と安全性

Jetson Thorでエッジ推論対応
SOMA-Xで骨格表現を標準化
エンドツーエンドの安全ガードレール構築

NVIDIAは2026年3月のGTCにおいて、ロボティクス開発基盤Isaacプラットフォームの大幅刷新を発表しました。クラウドからエッジまで一貫したワークフローを提供し、データ収集・訓練・シミュレーション・実機展開を統合的に支援します。

新たに公開されたGR00T Nは、視覚・言語・行動を統合する推論VLAモデルで、開発者が独自のロボット知能を構築する基盤となります。汎用的な理解力と特定タスクへの専門訓練を両立する「ゼネラリスト・スペシャリスト」型ロボットの実現を目指しています。

Omniverse NuRecのGA提供により、実世界のセンサーデータからOpenUSDベースの3Dシミュレーション環境を構築可能になりました。Gartnerの予測では、2030年までにエッジシナリオの訓練データの90%以上が合成データになるとされ、NVIDIAはこの転換を加速する合成データ工場の参照設計をCosmos基盤モデルとともに提供します。

Isaac Lab 3.0では数千の軽量シミュレーション環境を並列実行し、実世界では数年かかる学習を数日で完了できます。オープンソース物理エンジンNewtonGoogle DeepMindのMujocoにも対応し、布や砂利など多様な物体との相互作用を再現します。

実機展開ではJetson ThorやJetson Orinがリアルタイム推論を担い、cuVSLAMライブラリで自己位置推定と地図構築を実現します。新フレームワークSOMA-Xは骨格・動作・アイデンティティの表現を標準化し、ハードウェア変更時の再統合作業を大幅に削減します。

安全面では、クラウドからロボット本体までのエンドツーエンド安全ガードレールを整備しました。教育リソースとしてIsaac Sim/Labの学習パスやNVIDIA Deep Learning Instituteの講座も提供し、新規参入の開発者を包括的に支援する体制を構築しています。

Hugging Faceオープンソース生態系、中国勢が米国を逆転

エコシステムの急成長

ユーザー1300万人に倍増
公開モデル200万超を達成
データセット50万件を突破
Fortune 500の30%超が参加

中国の台頭と地政学

中国がダウンロード数で米国を逆転
Qwen派生モデルが20万件超
韓国欧州AI主権を推進

技術トレンドの変化

ロボティクスデータセットが23倍増
小型モデルの実用採用が加速

Hugging Faceは2026年春のオープンソースAI生態系レポートを公開しました。2025年にユーザー数は1300万人に達し、公開モデルは200万件超、データセットは50万件を突破するなど、すべての指標がほぼ倍増しています。

中国が月間ダウンロード数で米国を逆転し、全ダウンロードの41%を占めるに至りました。DeepSeek R1の公開を契機に、Baiduは2024年のゼロから100件超のリリースへ急増し、ByteDanceやTencentも8〜9倍にリリース数を拡大しています。

企業の開発シェアは2022年以前の約70%から2025年には37%に低下しました。一方、個人や小規模コミュニティがダウンロードの39%を占め、量子化やファインチューニングを通じてモデルの流通を主導する存在へと成長しています。

各国政府はAI主権の確保に動いています。韓国は国家ソブリンAIイニシアティブを発足させ、LG AI ResearchやNaverなど国内企業を指名しました。スイスやEU各国も公的資金によるオープンモデル開発を推進し、Reflection AI韓国データセンター提携も発表されています。

ロボティクス分野ではデータセットが2024年の1,145件から2025年に26,991件へと急増し、Hub最大のカテゴリとなりました。科学研究でもタンパク質折りたたみや創薬への応用が進み、オープンソースAIは言語・画像生成を超えて物理世界への拡張を加速させています。

NVIDIA主導で医療ロボット初の大規模オープンデータセット公開

データセットと規模

778時間医療ロボットデータ
手術・超音波・内視鏡を網羅
35組織が国際共同構築
CC-BY-4.0で完全公開

基盤AIモデル2種

GR00T-H:手術用VLAモデル
縫合タスクの端到端実行を実証
Cosmos-H:手術シミュレータ
実機2日分を40分で再現

NVIDIAとジョンズ・ホプキンス大学、ミュンヘン工科大学らが主導する国際コミュニティが、医療ロボティクス分野初の大規模オープンデータセット「Open-H-Embodiment」を公開しました。35組織が参加し、778時間分のCC-BY-4.0ライセンスデータを提供しています。

データセットは手術ロボティクスを中心に、超音波検査や大腸内視鏡の自律制御データも含みます。シミュレーション、ベンチトップ訓練、実臨床手術にまたがり、CMR SurgicalやRob Surgicalなどの商用ロボットおよびdVRK、Frankaなどの研究用ロボットのデータを収録しています。

同時に公開されたGR00T-Hは、NVIDIAのVision-Language-Actionモデルを手術ロボット向けに特化させた初のポリシーモデルです。約600時間のデータで訓練され、SutureBottベンチマーク端到端の縫合タスクを完遂する能力を実証しました。異なるロボット間の運動学的差異を吸収する独自の設計が特徴です。

Cosmos-H-Surgical-Simulatorは、運動指令から物理的に妥当な手術映像を生成するワールド基盤モデルです。従来のシミュレータでは再現困難な軟組織変形や反射、出血を暗黙的に学習します。実機で2日かかる600回のロールアウトをわずか40分で完了でき、データ拡張にも活用可能です。

次期バージョンでは、意図・結果・失敗モードを注釈した推論対応データへの拡張を目指しています。手術ロボットが状況を説明し、計画を立て、長時間の手術に適応できる推論能力付き自律制御の実現が目標です。データセットとモデルはHugging FaceおよびGitHubで公開されており、コミュニティへの参加を呼びかけています。

Rivian発のMind Robotics、産業用AIロボットで500億円調達

巨額資金調達の全容

シリーズAで5億ドル調達
Accela16zが共同リード
企業評価額約20億ドル
シード含め総額6.15億ドル

産業用ロボットの新戦略

Rivian工場データで訓練
人型ロボットではなく実用設計重視
年内に大規模配備を計画
独自チップ転用も視野

RivianのCEO兼創業者RJ・スカリンジ氏が設立した産業用ロボティクス企業Mind Roboticsが、シリーズAラウンドで5億ドル(約750億円)資金調達を完了しました。AccelとAndreessen Horowitzが共同でリードし、企業評価額は約20億ドルに達しています。

同社は2025年11月にRivianからスピンアウトし、シードラウンドの1.15億ドルと合わせて総額6.15億ドルを数カ月で調達しました。スカリンジ氏は会長を務め、Rivianでの垂直統合型ハードウェア企業の経験を産業用ロボティクスに応用する構想です。

現在の産業用ロボット反復的で安定した作業には優れていますが、工場における付加価値の高い作業の多くは人間のような器用さや適応力、物理的推論を必要とします。Mind Roboticsはこの構造的なギャップを埋めるAI基盤の構築を目指しています。

スカリンジ氏はTeslaなどが開発するヒューマノイドロボットとは一線を画し、より伝統的な工場向けロボット設計に注力する方針を示しています。「バク転ができても製造業には価値を生まない」と同氏は述べ、実用性を最優先する姿勢を明確にしました。

Rivianの工場はデータフライホイールの役割を果たし、大量生産環境での豊富なデータがモデル改善に活用されます。さらにRivianが開発中の自動運転向け独自チップをMind Roboticsに供給する可能性もあり、両社の連携による競争優位の構築が期待されています。

ルクン氏がMeta退社後初の起業、世界モデルAIに10億ドル調達

AMIの事業構想

評価額35億ドルで10億ドル調達
物理世界を理解する世界モデル構築
パリ・NY・モントリオール等4拠点で始動
トヨタ・サムスン提携予定

LLMへの対抗姿勢

LLMで汎用知能は実現不可能と主張
オープンソースでの技術公開を計画
製造・医療ロボット分野に注力

AI統治への提言

AI管理は民主的プロセスで決定すべき
特定企業の独占的支配に反対を表明

ヤン・ルクン氏が共同創業したパリ拠点の新興企業Advanced Machine Intelligence(AMI)は、物理世界を理解するAI世界モデルの開発に向けて10億ドル以上資金調達を発表しました。企業評価額は35億ドルで、ベゾス・エクスペディションズやキャシーイノベーション等が共同出資しています。

ルクン氏は、人間の推論の大部分は言語ではなく物理世界に根ざしていると主張し、大規模言語モデル(LLM)の延長線上に汎用人工知能は存在しないと断言しています。「LLMの能力を拡張すれば人間レベルの知能に到達するという考えは完全なナンセンスだ」と述べ、OpenAIAnthropicなど主要AI企業の方向性に真っ向から異を唱えました。

AMIはルクン氏がMeta在籍時に推進していた世界モデル研究を商業化する初の試みです。Meta社内でLLM重視への戦略転換が進む中、ルクン氏は2025年11月にザッカーバーグCEOに退社を申し出ました。Metaは出資者ではありませんが、スマートグラス向けアシスタントなどでの協業を協議中とのことです。

共同創業者にはMetaの元研究科学ディレクターのマイケル・ラバット氏、元Google DeepMind研究者のサイニン・シエ氏らが名を連ねます。CEOにはAIヘルスケア企業Nablaの元CEOアレクサンドル・ルブラン氏が就任し、製造業・バイオメディカル・ロボティクスなどの企業向けに世界モデルを提供する計画です。

ルクン氏はAI技術のオープンソース化を推進する方針を示し、「AIは一企業が支配するには強力すぎる」と強調しました。最終的にはあらゆる産業で活用可能な汎用世界モデルの構築を目指しており、まずはトヨタやサムスンなどのパートナー企業と協力しながら、航空機エンジンの最適化など具体的な応用から段階的に展開していく方針です。

NVIDIAジェットソンがエッジAIの新標準に、重機から家庭まで展開

エッジ推論の実用例

キャタピラー重機に音声AIアシスタント搭載
クラウド不要のローカル推論を実現
Jetson Thorがリアルタイム処理を担保
ロボット・スマートホームにも展開

対応オープンモデル群

GemmaMistralQwen主要モデルに対応
GR00T N1.6でロボット動作を自律制御
vLLMで最大273トークン/秒を達成
2B〜30Bパラメータを柔軟に切り替え

NVIDIAは2026年のCESにおいて、エッジAIプラットフォーム「Jetson Thor」上でキャタピラーの小型油圧ショベル向け音声AIアシスタントのデモを公開した。Qwen3 4BモデルをvLLC経由でローカル動作させ、クラウド接続なしで低遅延な自然言語応答を実現している。

従来のオープンモデルはデータセンターで運用されてきたが、クラウド依存はレイテンシとコストの課題を抱える。Jetsonはシステムオンモジュールにコンピュートとメモリを統合し、メモリ不足による調達難を解消しながら、産業機器向けに安定したエッジ推論環境を提供する。

ロボティクス分野ではFranka RoboticsのFR3 DuoがオンボードでGR00T N1.6モデルを実行し、タスクスクリプト不要で知覚から動作まで完結させた。NYU・UIUCなどの研究機関もJetson Thor上でヒューマノイド制御や抹茶製造ロボットの開発に成功している。

個人開発者レベルでも活用が広がっており、Hugging FaceのAndré Marafiotiはエージェント型AIシステムをJetson AGX Orin上で構築し、タスク自律スケジューリングを実現した。CollabnixのAjeet Singh RainaはOpenClawをJetson Thor上で24時間稼働させ、メール・カレンダー管理を自動化している。

Jetson Thorは現在、Gemma 3・Mistral 3・Qwen 3.5・gpt-oss-20B・NVIDIA Cosmosなど主要オープンモデルを広くサポートしており、開発者はvLLM・Ollamallama.cppなど多様なフレームワークを選択できる。GTC 2026では産業自律化の未来をテーマにした展示も予定されている。

AIエージェントがVCの投資判断を自動化するADIN登場

ADINの仕組みと実績

複数のAIエージェントが審議
1時間でデューデリ完了
実案件に10万ドルを出資

VC業界への二重の脅威

AIでスタートアップ低コスト化加速
資金需要の消滅が最大の懸念
SaaS投資モデルの崩壊リスク

残る人間の役割

ネットワーク形成は人間が担当
最終投資決定は人間が判断

2025年、米国のTribute Labsが立ち上げたADIN(自律型ディール投資ネットワーク)は、複数のAIエージェントがピッチデッキを解析し、約1時間で投資判断を下すプラットフォームです。実際にAIスタートアップへ10万ドルの出資を実行しました。

ADINはTech Oracle・Unit Master・Monopoly Makerなど個性の異なる12種類のエージェントを擁し、技術・財務・市場独占性をそれぞれ評価します。過半数が支持した案件に推奨投資を提示する仕組みで、通常数週間かかるデューデリジェンスを大幅に圧縮します。

VC業界はここ10年でソフトウェアSaaSから多くの利益を得てきましたが、AIの進化でスタートアップ創業コストが激減しています。かつて200万ドルのシードが必要だったプロダクトが、今や数十万ドル以下で実現可能となり、Midjourneyのように約100人で年間3億ドル超の売上を誇る無資金ユニコーンも登場しました。

ADINの共同創業者Aaron Wrightは、AIが「悪い案件を排除し、成功確率を高める」と期待する一方、著名VCのマーク・アンドリーセンは「VC投資はサイエンスではなくアートであり、最後まで人間が担う仕事だ」と反論します。KhoslaやFelicisなど大手VCもAIをメモ作成・ディールソーシング・創業者評価に活用し始めており、人とAIの協業が加速しています。

最大のリスクは、AIがVCを代替することではなく、スタートアップVC資金を必要としなくなることです。ロボティクスやバイオテックなどハードウェア領域を除き、巨額調達の需要が消滅すれば、VC業界は小規模な専門領域へ回帰する可能性があります。「資金はあるが創業者に必要とされない」という構造的危機に、投資家たちは今夜も眠れぬ夜を過ごしています。

HuggingFace、LeRobot v0.5.0でヒューマノイド対応と6つの新ポリシーを追加

ハードウェア拡張

Unitree G1ヒューマノイド初対応
全身協調制御(WBC)の実現
OpenArmロボットアームの統合
CANバスモーター対応で高性能化

AIポリシーと高速化

Pi0-FAST自己回帰VLAの導入
Real-Time Chunkingで推論の応答性向上
LoRA/PEFTで大規模VLAの効率微調整
画像学習10倍高速化を実現

エコシステム整備

EnvHubでHub上のシミュレーション環境を直接利用
NVIDIA IsaacLabとのGPU並列学習統合
サードパーティポリシープラグイン対応
ICLR 2026採択で学術的評価を獲得

Hugging Faceは2026年3月にオープンソースロボット学習フレームワーク「LeRobot」のv0.5.0をリリースした。同バージョンでは初のヒューマノイドロボット対応や6つの新ポリシー追加、データパイプラインの大幅な高速化など、あらゆる次元でのスケールアップが実現されています。

最大のハードウェア追加はUnitree G1ヒューマノイドの全面サポートです。歩行・ナビゲーション・物体操作・遠隔操作に加え、全身協調制御(WBC)により移動と操作を同時実行できる。これはLeRobotが卓上アームを超えた汎用ロボティクスへ踏み出す重要な一歩となっています。

ポリシー面ではPi0-FASTが注目されます。Gemma 300Mベースの自己回帰型アクションエキスパートを採用し、FASToトークン化によって離散化されたアクション列を生成します。また推論技術のReal-Time Chunking(RTC)は、フローマッチングポリシーの応答性を劇的に改善し、実世界デプロイでのレイテンシ問題を解消します。

データセットパイプラインではストリーミングビデオエンコーディングの導入により、エピソード記録後のエンコード待ち時間がゼロになりました。さらに画像学習が最大10倍、エンコードが3倍高速化されており、データ収集からモデル訓練までのサイクルが大幅に短縮されています。

コードベース面ではPython 3.12+とTransformers v5への移行が完了し、サードパーティポリシープラグインシステムの導入でエコシステムの拡張性が向上しました。EnvHubとNVIDIA IsaacLab-Arenaの統合により、シミュレーション環境の共有・活用も容易になっています。同論文はICLR 2026にも採択されており、学術コミュニティからの評価も高まっています。

ABBロボティクスとNVIDIA、工業用物理AIで戦略提携

技術統合の概要

RobotStudio HyperRealityを新投入
展開コストを最大40%削減
市場投入を最大50%短縮
2026年後半に一般提供開始

実証と活用事例

Foxconnが電子機器組立で先行試験
Workrが中小製造業向けに展開
設定・試運転時間を最大80%短縮
合成データで位置誤差0.5mmを実現

ABBロボティクスNVIDIAは2026年3月、産業向け物理AIの実現に向けた戦略的提携を発表しました。ABBのロボットプログラミング・シミュレーションスイート「RobotStudio」にNVIDIA Omniverseライブラリを統合し、新製品「RobotStudio HyperReality」を2026年後半に提供開始する予定です。

今回の提携の核心は、長年の課題とされてきたシム・トゥ・リアルギャップの解消にあります。HyperRealityはロボット・センサー・照明・運動学などをUSDファイルとしてOmniverseに出力し、物理ロボットと同一ファームウェアで動く仮想コントローラーを実行することで、シミュレーションと実機の相関性を99%まで高めます。

ABBのAbsolute Accuracy技術との組み合わせにより、位置決め誤差を従来の8〜15mmから約0.5mmに大幅削減できます。Omniverseが生成する合成画像をAI学習パイプラインに直接投入することで、ビジョンモデルの学習をすべてシミュレーション内で完結させることも可能です。

先行パイロットでは世界最大の電子機器受託製造企業Foxconnが消費者向け電子機器の組立ラインで導入を検討しており、物理試験の排除とセットアップ時間の短縮を見込んでいます。米国ロボット自動化企業Workrは自社プラットフォーム「WorkrCore」と統合し、プログラミング専門知識不要で新部品を数分でオンボーディングできるシステムをNVIDIA GTC 2026でデモ予定です。

ABBロボティクスはさらにNVIDIA JetsonエッジAIプラットフォームをOmnicoreコントローラーへ統合することも検討しており、ロボットポートフォリオ全体でリアルタイム推論を可能にする方針です。世界6万人以上のロボットエンジニアが使うRobotStudioに物理AIが標準搭載されることで、製造業のデジタルトランスフォーメーションが加速すると見られています。

国際チームがアリ792種の3D解剖アトラスを公開

Antscanの概要

792種212属を網羅
マイクロメートル解像度で3D再構築
外骨格・筋肉・神経・消化管を可視化
無料ポータルで誰でも閲覧可能

技術と応用展望

シンクロトロンで高速撮影
200TB超のデータをAIで自動解析
ロボティクス設計への応用期待
博物館標本のデジタルツイン

国際研究チームは2026年3月、Nature Methods誌においてアリの形態を網羅的に3D化した解剖アトラス「Antscan」を発表しました。このプラットフォームは212属792種をカバーし、既知のアリの多様性の大部分を収録しています。

Antscanの最大の特徴は、マイクロメートル解像度の再構築により、外骨格だけでなく筋肉・神経・消化管・針といった内部構造まで精密に可視化できる点です。無料のインタラクティブポータルを通じ、誰でもノートPCから回転・拡大・仮想解剖が可能です。

撮影にはドイツ・カールスルーエ工科大学のシンクロトロン放射光施設が活用されました。粒子加速器が生成する高輝度X線により、従来の染色処理なしで軟組織のコントラストを数秒で取得でき、約2,200の保存標本を自動化パイプラインで効率的に処理しました。

200テラバイト超の撮影データはニューラルネットワークを用いて自動的に解剖構造を識別・分析し、3Dボリュームへと再構築されました。研究チームはすでにこのデータを活用し、アリの外殻投資量と群体サイズの関係や、菌栽培アリに特有のバイオミネラル装甲の分布を解明しています。

プロジェクトを共同主導したエヴァン・エコノモ氏は、このデータセットがロボティクスエンジニアリング分野でのバイオメカニカル設計にも活用されることを期待しています。チームはAntscanを昆虫にとどまらず甲虫・クモ・甲殻類など小型無脊椎動物全体のデジタルツイン化の青写真と位置づけ、「形態のゲノム」として形態学に革命をもたらす構想を描いています。

Microsoft、150億パラメータの視覚推論モデルPhi-4をオープン公開

モデルの特徴と性能

150億パラメータの軽量マルチモーダルモデル
競合比5分の1のデータ量で訓練
数学・科学推論GUI操作に特化
精度と推論速度のパレート最適を実現

推論の選択的制御

思考・非思考の混合モード搭載
画像認識は直接応答で低遅延実現
数学問題は段階的推論で精度向上
ユーザーがモード手動切替も可能

公開とエコシステム展開

HuggingFaceGitHub重み公開
Phiファミリーがロボティクス領域にも拡大

Microsoft Researchは、150億パラメータのオープンウェイト・マルチモーダル推論モデルPhi-4-reasoning-vision-15B」を公開しました。テキストと画像の両方を処理し、数学・科学の推論、チャート読解、GUI操作など幅広いタスクに対応します。

最大の特徴は訓練効率の高さです。約2000億トークンのマルチモーダルデータで訓練されており、QwenGemma3など競合モデルが1兆トークン以上を使用するのに対し、およそ5分の1のデータ量にとどまります。その秘訣はオープンソースデータの徹底的なフィルタリングと品質改善にあります。

技術的に注目すべきは「混合推論」アプローチです。訓練データの約20%に思考過程を含む推論サンプルを、80%に直接応答のサンプルを使用し、モデルがタスクに応じて推論の要否を自動判断する仕組みを実現しました。画像キャプションでは即座に応答し、数学では段階的に思考します。

ベンチマーク評価では、ChartQAで83.3、MathVistaで75.2、ScreenSpot v2で88.2のスコアを記録しました。大型モデルのQwen3-VL-32Bには及ばないものの、同規模モデルを上回り、推論速度と精度のバランスでパレート最前線に位置しています。

Microsoftは本モデルをMIT許容ライセンスで公開し、ファインチューニングコードや評価ログも提供しています。Phiファミリーはエッジデバイス向けのPhi Silicaロボティクス向けのRho-alphaにも拡大しており、「最も賢いモデルは最大のモデルではなく、いつ考えるべきか知っているモデルだ」という戦略を鮮明にしています。

Black Forest Labs、外部教師不要の自己学習手法で訓練速度2.8倍に

Self-Flowの技術革新

外部エンコーダ依存を完全排除
二重タイムステップ方式で自己蒸留
画像動画音声統一学習を実現

性能と効率の飛躍

従来比約50倍の訓練ステップ削減
FID 3.61でREPA超えの画質達成
テキスト描画精度が大幅向上
ロボット制御タスクでも高成功率

企業への戦略的意義

計算コスト3分の1で最先端到達
外部モデル依存排除で技術負債削減

独Black Forest Labsは、生成AIモデルの訓練において外部の意味理解モデルに依存しない新手法「Self-Flow」を発表しました。従来のStable DiffusionやFLUXなどの拡散モデルはCLIPやDINOv2といった凍結エンコーダに頼っていましたが、この制約を根本から解消する技術です。

Self-Flowの核心は「二重タイムステップスケジューリング」と呼ばれる仕組みです。入力データに異なるレベルのノイズを適用し、生徒モデルには強く劣化させたデータを、教師モデル(自身のEMA版)にはより鮮明なデータを与えます。生徒が教師の見ている内容を予測する自己蒸留により、生成と意味理解を同時に学習します。

実用面での成果は顕著です。Self-Flowは現行標準のREPA手法と比較して約2.8倍高速に収束し、従来のバニラ訓練と比べると必要ステップ数は約50分の1に削減されました。40億パラメータのマルチモーダルモデルでは、画像FID 3.61、動画FVD 47.81とREPAを上回るスコアを記録しています。

特筆すべきはマルチモーダル対応力です。AIが苦手としてきたテキスト描画の精度が大幅に向上し、動画生成では手足が消える幻覚アーティファクトが解消されました。さらに映像と音声同期生成も単一プロンプトから可能になり、外部エンコーダでは困難だった領域を克服しています。

企業にとっての戦略的価値も大きく、計算予算を約3分の1に圧縮しつつ最先端性能を達成できます。ロボティクス分野では675Mパラメータ版をRT-1データセットで微調整し、複雑な多段階タスクで高い成功率を実現しました。外部エンコーダへの依存排除により、技術負債の削減とスケーラビリティの確保が可能となり、自社データに特化した独自モデル開発の現実性が大きく高まっています。

GoogleがオープンソースロボAIに参入

物理AI戦略の核心

ロボティクスAndroid」を完全に掌握
オープンソースからクローズドコントロールへ転換
フィジカルAIでの主導権確立を宣言

The Vergeによれば、Googleはオープンソースのロボティクスプロジェクト「Androidロボティクス」の管理権を完全に掌握しました。物理的な世界でのAI(Physical AI)市場における主導権確立を狙う動きです。

NVIDIAのIsaacやFigureなどとのフィジカルAI競争が激化する中、Googleは自社のAIモデルとロボティクスプラットフォームを統合した独自エコシステムの構築を本格化させています。

IntrinsicがGoogleへ合流し物理AIへ

統合の概要

IntrinsicがAlphabetからGoogleに移管
産業用ロボットより賢くするAIソフト
物理AI分野での存在感強化が目的

戦略的意義

Google DeepMindとの連携が加速
製造・物流向け産業ロボット市場を狙う
Boston Dynamicsとの差別化を図る

AlphabetのロボティクスソフトウェアカンパニーIntrinsicがGoogleに正式合流することが発表されました。Intrinsicは産業用ロボットをより柔軟でアクセスしやすくするAIモデルとソフトウェアを開発してきました。

GoogleへのIntrinsic統合はGoogle DeepMindロボティクス研究との連携を強化し、物理的な世界でのAI実行能力を高める狙いがあります。製造・物流分野における産業ロボットのAI化が一段と加速するでしょう。

World Labsが10億ドルで空間AI開発

空間AI・世界モデルへの大型投資

10億ドルの大型調達
Autodeskが2億ドル出資
世界モデル開発の加速

空間AI・世界モデル専門のスタートアップWorld Labsが、Autodeskからの2億ドルを含む総額10億ドルの資金調達を発表しました。創業間もないスタートアップへの大型投資として注目を集めています。

World Labsは3D空間を理解し操作できる世界モデルの開発に取り組んでいます。建築・製造・設計ツールを提供するAutodeskの出資は、世界モデルの産業応用に対する強い期待を示しています。

空間AIロボティクス、自動運転、VR/AR、デジタルツインなど幅広い分野への応用が期待されており、次世代AIの重要な柱となることが予想されます。

AmazonがBlue Jayロボットを中止

ロボット開発の挫折

Blue Jayプロジェクト終了
6ヶ月未満での撤退
倉庫自動化の課題

Amazonはわずか6ヶ月足らずで倉庫ロボティクスプロジェクト「Blue Jay」を中止したことが明らかになりました。詳細な理由は公表されていませんが、技術的・コスト的課題が原因とみられています。

Amazonは倉庫自動化に多額の投資を続けていますが、Blue Jayの早期終了はロボティクス開発の難しさを示しています。

ボストン・ダイナミクスCEOが退任

退任の経緯

Playter氏が退任を発表
30年間の貢献に区切り
社内メモで通知

ロボティクスの今後

人型ロボット市場が活況
次期リーダーの方針に注目
Hyundai傘下での新展開

Boston DynamicsのCEO、Robert Playter氏が30年間の在籍を経て退任を発表しました。社内メモで従業員に通知されています。

同氏は四足歩行ロボットヒューマノイドの開発で知られるBoston Dynamicsの成長を牽引してきました。ロボティクス業界の象徴的なリーダーの交代です。

現在Boston DynamicsはHyundai傘下にあり、商用ロボットの展開を加速しています。新CEOの戦略方針が今後の方向性を左右します。

人型ロボット市場ではFigure、Apptronikなどの新興企業も台頭しており、競争環境が急速に変化しています。リーダー交代はこの流れに影響を与えます。

ロボティクスとAIの融合が進む中、Boston Dynamicsの次のステージがどのような形になるかが業界の注目を集めています。

Microsoftがアフリカ向けAIアクセシビリティ基盤PazaとPazaBenchを公開

PazaとPazaBenchの内容

Microsoft ResearchがPazaを公開
アフリカの低リソース言語対応
PazaBenchで評価基準を提供
AIの声を多様化する取り組み
模倣学習の新手法PIDMも発表
Microsoftの社会的影響力を強調

グローバルAIの包摂性

言語格差の解消に向けた前進
新興市場でのAI普及促進
研究コミュニティへの貢献

Microsoft Researchは2026年2月5日、アフリカの低リソース言語向けAIプラットフォーム「Paza」と評価ベンチマーク「PazaBench」を発表した。

Pazaはアフリカに存在する数千の言語のうち、デジタルリソースが少ない言語のための音声認識・自然言語処理基盤を提供する。

PazaBenchは研究者がアフリカ言語AIモデルを標準化された方法で評価・比較できる基準を提供し、この分野の研究を加速させる。

同時にMicrosoftは模倣学習の新手法「PIDM(予測的逆動力学モデル)」を公開し、ロボティクスと意思決定AIの研究に貢献した。

グローバルなAI包摂性への投資は単なる社会責任活動を超え、新興市場でのビジネス基盤を長期的に構築する戦略的意義を持つ。

Carbon RoboticsのAI植物認識モデルが農業の雑草除去を精密化

Large Plant Modelの特徴

数千種の植物を識別
LaserWeederとの統合
農家の目をAIで代替

農業AIの展望

精密農業の実現
農薬使用量の削減
食料安全保障への貢献

Seattle発の農業ロボット企業Carbon Roboticsは、植物の種類を精密に識別するAIモデル「Large Plant Model(LPM)」を発表しました。レーザーで雑草を除去するLaserWeedsと組み合わせることで、除草剤なしの精密農業を実現します。

LPMは数千種類の植物を認識できる汎用的なビジョンモデルで、作物と雑草を区別するだけでなく、植物の健康状態や成長段階も判断できます。

農薬使用量を削減しながら収量を維持するという農業の根本的な課題に対し、コンピュータビジョンロボティクスの組み合わせが解決策を提示しています。

Climate Changeによる農業リスクが高まる中、AIロボティクスを使った精密農業は、食料安全保障と持続可能性を両立させる重要技術として注目されています。

農業AI市場は今後急拡大が予想され、Carbon Roboticsのようなスペシャリスト企業の価値は一層高まるでしょう。

ヤン・ルカンが率いるAMI Labs世界モデルスタートアップの実態

AMI Labsの概要

ヤン・ルカンMeta AIチーフが創設
世界モデル(World Model)に特化
LLMと異なる認知アーキテクチャ
AGIへの別アプローチ

技術的差別化

予測型世界モデルの開発
LLMの限界を克服する設計
ロボティクスへの応用
マルチモーダルな世界理解

TechCrunchはヤン・ルカン(Meta AI チーフサイエンティスト)が立ち上げた世界モデルスタートアップ「AMI Labs」の詳細を報じた。LLMとは異なる認知アーキテクチャAGIを目指す。

AMI Labsは、AIが物理世界を理解・予測する「世界モデル」の構築に注力しており、ルカンが長年主張するLLMの限界(推論・計画・物理理解の欠如)を克服しようとしている。JEPAアーキテクチャが基礎だ。

現在のLLM主流に対するオルタナティブとして注目され、ロボティクスや自動運転など物理世界との対話を必要とするAI用途に有望とされる。

最初のヒューマノイドロボット同僚はおそらく中国製になる

中国ロボット産業の台頭

中国メーカーがコスト優位を確立
Unitree・Agilityなどが世界展開
製造ラインへの先行導入
政府補助で開発が加速
欧米より低価格で高性能

職場への影響

倉庫・工場から導入が始まる
危険作業の代替が最初
人間との協働モデルが普及
雇用への影響が議論に
規制整備が後追いになる

ヒューマノイドロボットの商用展開が現実化しつつある中、初期の「職場のロボット同僚」は中国製になる可能性が高いという分析が出ています。コスト競争力と製造能力の面で中国が先行しています。

中国ロボティクス企業は政府の強力な支援を受けており、ハードウェアコストの低下とAI能力の向上が組み合わさって急速な製品化が進んでいます。

倉庫の荷物運搬や工場での組み立て作業など、繰り返し作業から導入が始まり、次第により複雑なタスクへと展開されていくと予想されます。

雇用への影響は避けられない問題であり、政府・企業・労働組合が協議して職場のロボット化に向けた社会的枠組みを整備する必要があります。

マルチモーダルRLとエージェント検証器でAIエージェントの信頼性を向上

研究の要点

マルチモーダル強化学習を採用
エージェント検証器が動作を確認
テキスト+画像での共同学習
誤行動の検出精度が向上
自律エージェントの安全性強化

応用への示唆

ロボティクスへの直接応用
GUI操作エージェントに活用
マルチステップタスクの精度向上
エラー回復機能が改善
監視コストの削減につながる

マルチモーダル強化学習エージェント型検証器を組み合わせることで、AIエージェントの信頼性を向上させる研究が発表されました。

エージェント検証器は、AIエージェントが次の行動を決定する前に、その行動が適切かどうかを独立したモジュールが評価します。これにより誤行動のリスクを事前にフィルタリングできます。

マルチモーダル入力(テキストと画像の組み合わせ)を使ったRLは、コンピュータ画面の操作やロボット制御など現実世界のタスクに応用しやすい特性があります。

エージェントの信頼性向上は本番環境での自律的なデプロイを可能にする前提条件であり、この研究はエージェントAIの実用化を前進させる重要な成果です。

ロボティクスソフトウェアのSkild AIが評価額1兆4000億円超で資金調達

調達の規模と背景

評価額140億ドルで資金調達完了
ロボティクスソフトウェア市場の高成長を反映
汎用ロボット制御ソフトウェアに特化
製造業・物流向けの需要が急増
大手投資家が参加する規模

ロボティクスソフトウェアメーカーのSkild AIが140億ドル評価額資金調達を完了しました。TechCrunchが報じたこの評価額は、物理AIとロボティクス市場への投資家の高い期待を反映しています。

Skild AIは汎用ロボット制御ソフトウェアに特化しており、製造業、物流、医療など多様な産業向けのロボットに対応します。ヒューマノイドロボット市場の急拡大と合わせて、ロボット制御ソフトウェアの市場規模も急増しています。

CES 2026総括:怪しいAI製品から過剰なスマートテレビまで

CES 2026 AIトレンドの全貌

The Vergeが「最も疑わしいAI活用」をまとめて批判
テレビメーカーが不要なAI機能を詰め込む過剰展開
スマートウォッシュマシン・冷蔵庫・便器にもAI搭載
AIを付けるだけでプレミアム価格を正当化する傾向
有用性より話題性を優先した製品が多数出展
「AIウォッシング」への批判が業界から噴出

本当に注目すべきCESの成果

物理AIデバイスとロボティクスの成熟が顕著
エッジAIの実用化が加速
医療・自動車・産業向けの真剣なAI統合
ガジェット系と産業系の二極化が鮮明に
メーカーは消費者の懐疑心に対応できていない
2026年のAIデバイス市場の成熟度が試される

CES 2026のAI製品の多くが、実際の有用性よりも「AIを搭載している」というマーケティングメッセージを優先していたとThe VergeやTechCrunchが批判的にまとめています。AIウォッシングと呼ばれる、AI機能を名ばかりに載せただけの製品が多く、消費者の信頼を損なうリスクがあります。

特にテレビメーカーは、AIが映像の自動最適化から番組選択、シーン解析まですべてを行うと主張しますが、実際の使用価値は限定的です。スマート家電全般でのAIバッジは、消費者が懐疑的になっている現実とギャップがあります。

一方で、自動車・医療・産業向けの真剣なAI統合は着実に進んでおり、CES全体を通じて「AIを活用したガジェット」と「AIで業務を変革するソリューション」の二極化が明確になりました。

Yann LeCun「知能の本質は学習であり記憶ではない」

LeCunのAI哲学と批判

LeCunがFT紙のインタビューでLLMの限界を再批判
「現在のLLMは本当の知能ではない」との持論を展開
人間の学習メカニズムとの根本的な違いを指摘
World Modelの重要性を改めて強調
Metaの次世代AIアーキテクチャの方向性を示唆
AGI達成にはLLMを超えたアプローチが必要と主張

研究コミュニティへの影響

Transformer以外のアーキテクチャ研究に注目
持続的な学習・適応型AIの重要性が再評価
感覚的学習・世界モデル研究への投資が増加
産業界でのLeCun批判への対応と議論が活発化
Meta AI Researchの独自研究路線が明確化
AGIへの道筋に複数の競合するビジョンが共存

Meta AIの研究責任者Yann LeCunはFinancial Timesのインタビューで、「知能の本質は学習にある、記憶にあるのではない」という持論を展開しました。現在主流のLLMは次のトークンを予測することで動作するが、これは人間の学習・理解とは根本的に異なると主張しています。

LeCunはWorld Modelと呼ばれる概念を強調しており、真の知能は世界の仕組みを内部的にモデル化し、その理解に基づいて行動計画を立てる能力を必要とすると言います。感覚と行動を通じた学習がAGI達成の鍵であるという独自のビジョンを持続的に発信しています。

LeCunの見解は業界において常に論争を引き起こしますが、LLM中心のアプローチへの挑戦として、ロボティクス・世界モデル・継続学習の研究コミュニティから支持を得ています。AGIへの複数のアプローチが並行して研究される2026年のAI研究の多様性を象徴する発言です。

a16z「Everything is Computer」論文でAIネイティブ時代のビジョンを提示

a16zの新しいコンピューティングビジョン

a16zが「Everything is Computer」論文を公開
あらゆるデバイス・空間がコンピューターとして機能する時代を予測
AIが物理世界とデジタル世界の境界を消去
スマートフォン・PC以外のデバイスが主要インターフェースへ
AIネイティブな計算環境の設計原則を提示
次世代スタートアップへの投資テーマを明示

投資家・起業家への示唆

物理AIデバイス市場が大型投資機会に
新しいUX・インターフェース設計のパラダイムが必要
センサー・アクチュエータとAIの統合が加速
スマートホーム・ウェアラブルロボティクスへの波及
インターネット以来最大の計算パラダイム転換の予測
既存ソフトウェア企業に対するディスラプションのリスク

a16zは「Everything is Computer」と題した長文の考察を公開し、AIによってあらゆる物理的なオブジェクトと空間がコンピューターとして機能する時代が来ると主張しました。スマートフォンやPCを超えた新しい計算パラダイムの到来を示す重要な投資テーゼです。

物理世界とデジタル世界の境界が消えることで、従来のソフトウェア・ハードウェアの区分が無意味になり、全く新しいカテゴリの製品・サービスが誕生すると予測しています。センサーとAI推論の統合が、あらゆるモノに知能を持たせることを可能にします。

a16zはこのビジョンに基づいて新しいスタートアップ投資を行う方針で、CES 2026に登場した物理AIデバイスの多様な展示とも合致するトレンドです。インターネット普及以来最大の計算パラダイム転換として捉えており、次の10年の投資地図を示す重要な論考です。

NvidiaがロボティクスAIスタック全体を公開:物理AIの時代が本格化

Cosmos Reason 2とAlpamayoの革新

Cosmos Reason 2ロボット向け推論VLMを実現
自律走行車・産業ロボット双方に適用可能
Alpamayoオープンソースモデルが自動車に思考力を
「人間のように考える」自動運転AIが目標
Isaac Lab-Arenaシミュレーション評価を自動化
LeRobotとの統合で汎用ロボット政策を評価

NvidiaがロボティクスのAndroidを目指す

ロボット向け共通基盤モデルを標準化
シミュレーション→実機の移行コスト削減
エッジAIハードウェアとの統合が鍵
MobileNet的な役割をロボティクスで担う
物理AIが製造・物流・農業を変革

Nvidiaは「物理AI」(Physical AI)という概念を中心に、ロボティクス向けAIスタック全体を公開した。Cosmos Reason 2は視覚言語モデル(VLM)に推論能力を組み合わせ、自動運転車や産業ロボットが複雑な物理環境を理解・判断できる基盤を提供する。

Alpamayoは自律走行車向けのオープンソースAIモデル群で、「人間のように考える」能力の実現を目指している。複数シナリオの推論・予測・意思決定を組み合わせることで、従来のルールベース自動運転からAI推論型へのパラダイムシフトを促進する。

Isaac Lab-Arenaはシミュレーション環境でロボット政策(Policy)を自動評価するツールで、実機テストのコストと時間を大幅に削減できる。LeRobotHugging Face)との統合により、汎用ロボット政策の標準的なベンチマーク基盤として機能する。

Jensen HuangのビジョンはNvidiaを「ロボティクスAndroid」として位置づけることだ。スマートフォンでAndroidが共通プラットフォームとして機能したように、Nvidiaロボットスタックがさまざまなハードウェアメーカーの共通基盤になることを目指している。

物理AIの普及は製造・物流・農業・医療など多岐にわたる産業に変革をもたらす。Nvidiaロボティクスエコシステムへの参加企業数が増加するにつれ、ネットワーク効果が働き業界標準としての地位が強固になる見通しだ。

CES 2026総括:すべてがAIに、問われるのは使い方

CES 2026の全体像

AIが消費者家電のあらゆる領域に浸透
Nvidia・AMD・QualcommAI半導体競争が加熱
TV・白物家電・ウェアラブルすべてにAI搭載
ロボット・自動運転が実用化フェーズ
エッジAIとクラウドAIの役割分担が明確化
今年のCESは「AI見本市」と評された

注目テックと今後の課題

ベストテックはAI×実用性の高い製品が選出
AI機能のUXへの統合品質が差別化ポイント
電力消費・プライバシー規制対応が課題
「AIのついた家電」から「AIネイティブ家電」へ
エコシステムの閉鎖性がユーザー体験を制限
2026年は消費者AIの品質元年になる可能性

CES 2026は「すべてがAI」という一言で総括できる。テレビから冷蔵庫、ウェアラブルから自動車まで、展示されたほぼすべての製品に何らかのAI機能が盛り込まれており、AIが消費者家電の標準部品となったことを印象づけた。

半導体メーカーの競争が見本市を彩った。NvidiaのVera Rubin・AMDの新Ryzen AI・QualcommのSnapdragon Xシリーズが登場し、AI処理性能のウォーは新局面を迎えた。特に「エッジでAI」という方向性が明確で、クラウド依存からの脱却が加速している。

ロボティクスは最も注目を集めたカテゴリーの一つで、LGのCLOiD・Nvidiaロボットスタック・Boston DynamicsとGoogleの協業など、汎用ロボットの実用化が現実に近づいていることを示した。ただし、一般家庭への普及には価格と信頼性の課題が残る。

WIREDやVergeが選ぶ「ベストテック」は、AI機能の有無より実際のユーザー体験の質を重視する傾向が強まっている。「AIが付いている」ことが差別化でなくなり、AIをいかに賢く・自然に・有用に使いこなすかが問われる時代になった。

CES 2026が示した最も重要なシグナルは、AI技術が「デモフェーズ」から「プロダクトフェーズ」に移行したということだ。実際の使い方・プライバシー・消費電力・規制対応という現実の課題と向き合いながら、どのメーカーが本物の価値を届けられるかが2026年の勝負となる。

CES 2026の家庭用AIロボット:LG CLOiDとZerothが洗濯・料理に挑む

LG CLOiDの機能と「ゼロ労働家庭」ビジョン

LG CLOiDが洗濯物の折り畳みと朝食準備を実演
「ゼロ労働家庭」を目指すLGのロボット戦略
AI搭載で家事タスクを自律的に実行
段階的な製品化と一般販売価格の注目点
センサー融合と物体認識技術が核心
CESで実際の動作デモを初披露

Zerothが描くWALL-E型ロボットの実用化

ZerothがWALL-Eを模した2種のロボット米国展開
消費者向けと商業向けの両ラインアップ
愛らしいデザイン人間との共生を促進
ロボティクスとAIの統合で自律行動を実現
価格帯と普及戦略が市場受容の鍵
家庭ロボット市場の本格立ち上がりを象徴

CES 2026でLGは家庭用AIロボット「CLOiD」が洗濯物の折り畳みと朝食準備を行うデモを披露した。LGが掲げる「ゼロ労働家庭」(Zero Labor Home)というコンセプトは、AIロボットが日常の家事を代替する未来ビジョンを体現している。

CLOiDは高度な物体認識ロボットアームの精密制御を組み合わせ、形状の異なる衣類を識別して折り畳む能力を持つ。従来のロボットが苦手としていた「非構造化タスク」(soft body manipulation)への挑戦は業界からの注目を集めている。

米国に本拠を置くスタートアップZerothは、Pixarの映画WALL-Eから着想を得た外観の小型AIロボット2種を発表した。消費者向けと商業向けに展開し、かわいらしいデザインで人間との感情的なつながりを意識した製品設計となっている。

家庭ロボット市場はiRobot(Roomba)・Amazon(Astro)・Samsung(Ballie)など大企業が参入を試みながらも、本格的な普及には至っていない。CLOiDとZerothの製品がこのマス市場化の壁を越えられるかが注目点だ。

価格帯と耐久性・安全性がカギを握る。家庭用ロボットは子供やペットが存在する環境で安全に動作する必要があり、安全認証と保険対応の整備も課題となる。2026年は家庭ロボットが「ガジェット」から「家電」として定着するかを占う重要な年になるだろう。

GPT-5よりQwen——中国AI競争が本格化

Qwenの台頭と実力

杭州Rokidのスマートグラスがリアルタイム多言語翻訳を実現
Qwen中国語NLPで圧倒的な強みを持つ
アリババ発のオープンソース戦略が差別化
GPT-5に匹敵または超える評価が広がる
ローカル言語特化でグローバル勢に優位性
コスト効率でも西側モデルを大幅に下回る

中国AI産業の現状

規制の壁を越えた革新が続いている
ハードウェア制裁を迂回した独自発展
ロボットスマートグラスでの実用化が進む
政府支援による大規模な研究投資
西側では見えにくい中国AI生態系の実力
2026年はグローバル競争が一層激化する見通し

杭州で取材したWIREDの記者は、Rokidのスマートグラス中国語→英語のリアルタイム翻訳を完璧にこなす場面に立ち会いました。背後にあるのはアリババが開発した大規模言語モデル「Qwen」です。

Qwenはオープンソースで公開され、中国語テキスト処理においてGPT-4Claudeと肩を並べるか上回る評価を受けています。アリババはハードウェア制裁にもかかわらず、ソフトウェア競争力で着実に地位を確立しています。

中国のAI産業は政府の大規模支援を背景に、スマートグラスロボティクス、自動運転など実世界への応用で急速に進化しています。GPT-5登場前後から「中国製モデルで十分」という声が増えており、競争軸が変わりつつあります。

米中AI競争は2026年にさらに激化する見通しです。Qwenのようなオープンソースモデルが無料で利用できる環境は、特にアジア太平洋地域でOpenAI依存からの脱却を加速させる可能性があります。

AlphaFold5周年と手術室AIが示す科学・医療分野のAI新展開

AlphaFoldの5年間の歩みと展望

AlphaFoldが2020年の登場から5周年を迎えノーベル賞を受賞
200万以上のタンパク質構造を予測した世界最大のデータベース構築
世界190カ国から350万人の研究者が利用する研究基盤に成長
AlphaFold 3でDNA・RNA・薬分子にまで対象を拡張
AIコサイエンティストGemini 2.0で仮説生成と検証を支援
細胞全体シミュレーションが次の10年の研究目標として浮上

手術室AIによる医療効率化

手術室の調整非効率で毎日2〜4時間の時間が無駄に
Akaraが熱センサーとAIで手術室効率を監視・最適化
プライバシーに配慮した熱センサーによる手術記録
英国NHSでの採用実績が米国市場参入の突破口に
看護師不足(40%が5年内退職予測)が自動化需要を後押し
医療ロボット普及の障壁はロボット性能でなくインフラ整備

2020年11月のAlphaFold 2登場から5年が経過しました。タンパク質折り畳み問題への深層学習アプローチは生物学の「iPhoneモーメント」と称され、現在では2億以上の予測構造を含むデータベースが世界190カ国の350万人の研究者に利用されています。ノーベル化学賞受賞という形で科学的インパクトが認められました。

AlphaFold 3では拡散モデルを採用し、タンパク質だけでなくDNA・RNA・低分子薬物の相互作用予測まで対象を広げました。しかし生成モデルの特性上、無秩序領域での構造ハルシネーションという新たな課題も生じています。検証の重要性がより高まっています。

DeepMindが開発したAIコサイエンティストはGemini 2.0上に構築されたマルチエージェントシステムで、仮説生成・議論・実験提案を行います。Imperial College Londonの研究者が薬剤耐性菌の研究でこのシステムを活用し、長年の研究結果と一致する仮説を短時間で導き出した実例が報告されています。

DeepMindの研究担当VP Pushmeet Kohliは、次の5年で「細胞全体を正確にシミュレーションする」という大きな目標を掲げています。ゲノムの仕組みを理解できれば、個別化医療の設計や気候変動対策のための新酵素開発も視野に入ると述べています。

アイルランド発スタートアップのAkaraは、手術室の「エアトラフィックコントロール」として機能するシステムを開発しています。熱センサーを活用することでプライバシーに配慮しつつ手術全体を記録・分析し、毎日2〜4時間失われているOR稼働時間の回収を目指しています。

医療ロボティクスの普及を阻む最大の障壁はロボット自体の性能ではなく、インフラ整備の遅れだとAkara CEOのConor McGinnは指摘します。看護師不足や手動スケジューリングの非効率さが解消されない限り、AI活用の恩恵は限定的にとどまると警告しています。

GoogleのAI研究8領域の2025年成果と手術室をAIで最適化するスタートアップ

GoogleのAI研究年間総括

医療・科学・マルチモーダルなど8領域の研究成果を公表
AIが「ツール」から「ユーティリティ」へと進化した年と総括
Gemini 3を含む次世代モデルの軌跡も紹介
科学的発見の加速にAIが貢献した事例が多数
基礎研究と実用化が2025年に融合し始めた
研究の社会実装が加速した年として位置づけ

手術室のAI最適化スタートアップ

毎日2〜4時間の手術室稼働ロスが課題
スケジュール調整と連携の非効率が主な原因
AIによる手術室コーディネーションで損失を削減
病院のコスト削減と患者スループット改善を両立
TechCrunchのEquityポッドキャストで紹介
実際の業務課題解決に集中したAI活用事例

Googleは2025年のAI研究成果を8つの主要領域に整理して公開しました。医療・科学・マルチモーダル・ロボティクスなど幅広い分野で、AIが単なるツールから社会基盤(ユーティリティ)へと転換した年だと総括しています。

TechCrunchのEquityポッドキャストは、手術室の調整問題を解決するAIスタートアップを紹介しました。手術そのものではなく、前後のスケジューリングと連携の混乱が毎日2〜4時間の稼働ロスを生んでいる問題に着目しています。

医療AIはファンシーなロボット手術より、実際のオペレーション課題に対応するソリューションが収益化しやすく実用的です。このスタートアップの取り組みは、AIが地道な業務効率化で最大のインパクトを発揮できることを示しています。

Lovable3.3億ドル調達とAI開発台頭

Lovableの急成長

3.3億ドル調達で評価66億ドル
8ヶ月でARR1億ドル突破
1日10万件超のプロジェクト生成

飲食・物流AIの台頭

Palonaが店舗の運営自動化
PickleがTesla幹部をCFOに
ピッキングロボが精度向上
Cursor23億ドル調達済み

スウェーデンのLovableはCapitalGとMenlo Ventures主導のSeries Bラウンドで3.3億ドルを調達し、評価額が66億ドルに達するというビッグテック以外では異例の成長を見せています。

創業からわずか8ヶ月でARR1億ドル、さらにその4ヶ月後には2億ドルを突破した異例のスピードで成長を続けており、1日に10万件を超えるプロジェクトがプラットフォーム上で作成されています。

PalonaAIはレストラン向けのPalona VisionとWorkflowを新たに発表し、既存の店内カメラとPOSデータを活用して食材管理から発注まで店舗運営を包括的に自動化します。

Palonaは特定ベンダーへの依存を排除した独自のオーケストレーション層を独自に構築しており、AIモデルを柔軟に切り替えられる設計によってシステムの長期的な安定運用を実現しています。

物流ロボティクスのPickle Robotは元Tesla幹部を最高財務責任者として新たに採用し、倉庫向けピッキングロボットの精度向上と大規模商業展開に向けた体制強化を本格的に進めています。

バイブコーディング(AI支援開発)分野ではCursorも2024年11月に23億ドルの調達を実施しており、AI開発ツール全般への大型VC投資の流れが業界全体で引き続き加速しています。

NVIDIAが物理AI安全と評価基準を強化

自動運転・ロボティクス安全基盤

OpenUSD Core 1.0で相互運用可能な3D標準が確立
NVIDIA Halos認定ラボがANAB認証取得
Bosch・Nuro・Wayveがロボタクシー安全検査に参加
Gaussian Splattingと世界モデルがシミュレーションを加速

オープン評価基準の確立

Nemotron 3 Nano 30B A3Bを完全公開の評価レシピと共にリリース
NeMo Evaluatorがオープンソースとして公開
ベンチマーク再現可能性と透明性向上を実現

NVIDIAは物理AI(ロボット・自動運転)の安全基盤と評価標準化で重要な進展を発表しました。OpenUSD Core Specification 1.0が公開され、自律システム向けの標準データ型・ファイル形式・合成動作が定義されました。

NVIDIA Halos AI Systems Inspection Labがニュースの中心で、AV安全の認定・検査機関としてANAB認証を取得しました。Bosch、Nuro、Wayveがロボタクシー向けの安全検査に参加しており、Onsemiが初の検査合格企業となっています。

シミュレーション技術の進化も注目されています。Gaussian Splattingを活用した4DレンダリングパイプラインのPlay4Dがリリースされ、World LabsのMarbleモデルがNVIDIA Isaac Simと連携してテキストプロンプトから物理シミュレーション対応の3D環境を数時間で生成できるようになりました。

Sim2Valフレームワークは、実世界とシミュレーションのテスト結果を統計的に組み合わせ、高コストな実走行テストへの依存度を下げながらAVの安全性を証明する方法を提供します。ミシガン大学Mcityの32エーカーAVテスト施設もOmniverseを活用したデジタルツインを強化しています。

評価の透明性という観点では、NVIDIAはNemotron 3 Nano 30B A3Bのリリースに際して完全な評価レシピを公開しました。オープンソースのNeMo Evaluatorを通じて、誰でも同じ評価パイプラインを再現できる「オープン評価標準」の確立を目指しています。

この取り組みはAI評価の信頼性向上に寄与するものです。多くのモデル評価で設定やプロンプト、実行環境の詳細が省略されている問題に対し、完全な再現可能な手法を提供することでコミュニティ全体の評価基準の標準化を促します。

1X、EQTに最大1万台のロボット供給

提携の概要

最大1万台のNeoロボットを供給
2026〜2030年の長期契約
EQTの300社以上が対象
製造・物流・倉庫向け

戦略的転換点

Neoは元々家庭用として販売
価格は$20,000で予約受付中
産業用途への大胆な方向転換
投資家関係を活用した販路確保

ロボティクス企業1Xが、スウェーデンの大手投資会社EQTの出資先企業向けに、最大1万台のNeoヒューマノイドロボットを供給する戦略的パートナーシップを発表しました。2026年から2030年にかけて、製造、倉庫、物流などの産業用途で展開されます。

この提携が注目される理由は、Neoが元々「家庭での生活を変える初の消費者向けヒューマノイドロボット」として10月に2万ドルで予約受付を開始していたことです。産業用ロボットEve Industrialを別に持ちながら、あえて家庭用Neoを産業向けに展開する戦略的転換です。

1XはEQTの出資先企業それぞれと個別に契約を結ぶ形式を取ります。投資家との関係を活用した販路確保であり、ヒューマノイドロボットの企業環境での商業的需要の高まりを示す象徴的な取引と言えます。

NVIDIA、Graph500で世界新記録 GPUがCPU領域を凌駕

グラフ処理で世界一の性能

H100クラスターがGraph500で首位を獲得
毎秒410兆エッジを探索する圧倒的処理速度
競合比で2倍の性能を達成

驚異的なコスト効率

わずか1/9のノード数で記録達成
費用対効果は競合システムの3倍以上
エネルギー効率もCPUの4.5倍

AIと計算の未来

推論時のスケーリングが次の焦点
複雑なスパース処理GPUへ移行
自律型AIやロボティクスへ応用拡大

NVIDIAは2025年12月、CoreWeaveと共同構築したH100 GPUクラスターにより、大規模グラフ処理性能を競う「Graph500」で世界新記録を樹立しました。これまでCPUが主役だった複雑なデータ処理領域においても、GPUが圧倒的な優位性を示し、計算インフラの歴史的な転換点を迎えています。

今回の記録では、毎秒410兆回のエッジ探索(TEPS)を達成しました。特筆すべきは、競合システムの2倍以上の性能を、わずか約9分の1のノード数で実現した点です。これは費用対効果において3倍以上の改善を意味し、企業のインフラ投資効率を劇的に高めます。

グラフ処理はデータが不規則で疎(スパース)なため、従来はCPUの独壇場でした。しかしNVIDIAは、通信と計算をGPU上で完結させる新技術を導入し、CPUを経由するボトルネックを解消しました。これにより、AI以外の科学技術計算でもGPUへの移行が加速します。

エネルギー効率を競う「Green500」でも、NVIDIAGPU搭載システムが上位5位を独占しました。CPUシステムと比較して平均4.5倍の効率を誇り、データセンター電力制約が厳しくなる中、持続可能な計算リソースの確保において決定的な解決策となります。

AI開発において、従来の「事前学習」「事後学習」に加え、推論時に計算量を増やす「テストタイム・スケーリング」が重要になっています。推論段階での高度な推論や計画能力が求められるようになり、学習完了後も強力なGPUインフラが必要不可欠です。

この計算能力の飛躍は、物理世界で活動するロボットや、自律的にタスクをこなすエージェントの実用化を後押しします。GPUは単なる演算装置から、全産業の生産性を底上げする「デジタル労働力」の基盤へと進化しています。

NeurIPS2025:強化学習への回帰とGoogleの復権

技術トレンドの転換点

スケーリングから強化学習(RL)
特定用途へのモデル調整が加速
継続学習や世界モデルが新潮流

激変する企業勢力図

中国や新興ラボが急速に台頭
物理AIロボティクスの実用化

2025年12月、サンディエゴで開催された世界最大級のAI国際会議「NeurIPS」にて、業界の潮流が決定的な転換点を迎えました。これまでのデータ量を追求する競争から、強化学習(RL)や推論能力の深化を目指す「研究の時代」へと、開発の主戦場が大きく移行しています。

最大の焦点は、会場のあらゆる議論を席巻した強化学習(RL)の再流行です。単に事前学習データを増やすスケーリング則の限界が意識され始め、特定のユースケースに向けてモデルを精緻に調整するアプローチが、次なる成長のドライバーとして認知されています。

企業間の勢力図においては、Google DeepMindが圧倒的な存在感を示しました。Gemini 3の発表や最多の論文採択数を背景に、技術的なリーダーシップを取り戻しています。一方でAnthropicも勢いを維持する中、OpenAIは相対的に注目度を分け合う形となりました。

新たな技術トレンドとして、継続学習(Continual Learning)や世界モデルへの関心が急上昇しています。静的なモデルではなく、環境との相互作用を通じて学習し続けるシステムの構築が、2026年に向けた重要な研究テーマとして浮上してきました。

また、AlibabaのQwenDeepSeekといった中国、およびReflection AIなどの新興ラボが台頭しています。彼らは既存の大手ラボとは異なるアプローチで成果を上げており、AI開発の多極化が進んでいることを印象づけました。

実用面では、デジタル空間を超えた物理AI(Physical AI)ロボティクスへの応用が加速しています。エージェントAIを単なるモデルではなく「スタック」として捉え、実社会の複雑な課題解決に直結させる動きが、エンジニアたちの関心を集めています。

DeepMind、英政府と提携拡大 科学・教育でAI実装加速

科学発見と新材料開発の加速

英国科学者に先端AIモデルへの優先アクセス権
2026年に材料科学特化の自動化ラボ英国内に設立

教育・公共部門の生産性革命

Gemini活用で教師の業務時間を週10時間削減
都市計画文書処理を2時間から40秒に短縮
AI家庭教師の導入で生徒の問題解決能力が向上

国家安全保障とリスク管理

英AI安全研究所と連携しAIリスクの評価を強化
サイバー脆弱性自動修正するAIツールの導入

Google DeepMindは2025年12月10日、英国政府とのパートナーシップを大幅に拡大し、科学、教育、公共サービス分野でのAI実装を加速させると発表しました。この提携は、先端AI技術を国家基盤に組み込むことで、経済的繁栄と安全保障を強化することを目的としています。特に、科学的発見のスピードアップや公共部門の生産性向上に焦点を当てており、AIを国家戦略の中核に据える英国の姿勢は、企業経営者にとっても組織へのAI導入の青写真となるでしょう。

科学技術分野では、英国の研究者に対し「AI for Science」モデル群への優先アクセスを提供します。これには、アルゴリズム設計を行う「AlphaEvolve」や気象予測モデル「WeatherNext」などが含まれます。特筆すべきは、2026年に英国内に設立予定の自動化ラボです。この施設では、Geminiと統合されたロボティクスが新材料の合成と特性評価を自律的に行い、超伝導体や次世代バッテリーなどの発見プロセスを劇的に短縮することを目指します。

教育と公共サービスの現場でも、具体的な成果実証が進んでいます。北アイルランドでの試験運用では、生成AI「Gemini」を活用することで教師の事務作業時間を週平均10時間削減することに成功しました。また、AI家庭教師システムを用いた生徒は、人間のみの指導を受けた生徒に比べ、新規問題への対応力が5.5ポイント向上しています。公共サービスでは、都市計画文書のデータ化処理時間を従来の2時間からわずか40秒へと短縮するツール「Extract」を導入し、行政の意思決定速度を飛躍的に高めています。

安全保障面では、英国のAI安全研究所(AISI)との連携を深め、モデルの説明可能性や社会的影響の研究を推進します。さらに、サイバーセキュリティ分野では、脆弱性の特定とコード修正を自動化する「Big Sleep」や「CodeMender」といったAIツールを活用し、国家レベルのサイバーレジリエンス強化を図ります。DeepMind英国政府の取り組みは、AIが単なるツールを超え、社会インフラとしての地位を確立しつつあることを示しています。

Meta新AIが動画で物理法則を習得、汎用ロボットへの道

「ピクセル」から「意味」の学習へ

従来のAIは細部に囚われ非効率
潜在表現で本質のみを学習
不要な情報を捨て効率的に処理

物理的直感と「驚き」の獲得

物理法則に反する現象を検知
テストで98%の高精度を記録
幼児のような物体恒常性を習得

ロボティクスへの展開と課題

少量データでロボット動作を計画
記憶保持時間の短さが課題

Metaが開発した新AIモデル「V-JEPA」は、動画視聴のみで物理世界の法則を直感的に理解します。従来のAIが苦手としたノイズ処理を克服し、自律型ロボットなどへの応用が期待される画期的な技術です。幼児が経験を通じて世界を学ぶように成長する、その革新的な学習メカニズムと、実用化に向けた今後の展望を解説します。

従来のAIはピクセル単位の処理により、背景の些細な動きなど本質的でない情報に惑わされがちでした。対してV-JEPAは、映像を抽象化した潜在表現を用いることで、重要な情報のみを効率的に抽出する仕組みを採用し、この課題を克服しています。

具体的には、映像の一部を隠し、その欠損部分の「意味」を予測させることで学習を進めます。単なる画素の復元ではなく、文脈や物体の動きといった高次元の情報を捉える訓練を行うため、より人間に近い形での状況理解が可能になります。

その実力は「IntPhys」と呼ばれる物理的直感テストで証明されました。重力や物体の永続性に反する映像を見せると、AIは予測エラーという形で驚きを示し、その正答率は約98%に達しました。これは幼児が世界を学ぶプロセスに酷似しています。

最新版の「V-JEPA 2」は、わずか60時間分のデータでロボットの動作計画を学習するなど、実用化に向け進歩しています。一方で、記憶できる時間が短く「金魚並み」であるといった課題も残されており、長期的な因果関係の理解が次の技術的焦点です。

音声指示で物体を数分生成、MITが「現実化AI」を開発

生成AIとロボットの融合

LLMと3D生成AIで設計を自動化
ロボットアームが数分で実体化
3Dプリントより高速なモジュール組立

製造の民主化と持続可能性

専門知識不要で誰でも製造可能
部品再利用により廃棄物を削減
ジェスチャー操作や大規模化も視野

米マサチューセッツ工科大学(MIT)の研究チームは2025年12月5日、音声指示だけで物理的な物体を生成する「Speech-to-Reality」システムを発表しました。生成AIとロボティクスを統合し、ユーザーが欲しいものを口にするだけで、ロボットアームが数分以内に家具などを自動で組み立てます。

このシステムは、大規模言語モデル(LLM)が音声を解析し、3D生成AIが設計図を作成することから始まります。生成されたデジタルデータはボクセル化アルゴリズムによって組み立て可能な部品構成に変換され、ロボットアームが最適な手順で物理的な構築を行います。

最大の特徴は、専門的な3Dモデリングやプログラミングのスキルが一切不要である点です。従来の3Dプリンティングが数時間から数日を要したのに対し、本システムはわずか数分で完了するため、製造プロセスの劇的な効率化と民主化を実現します。

また、組み立てにはモジュール式のコンポーネントを使用しており、持続可能性にも配慮されています。不要になった家具は分解して別の物体へと作り変えることができるため、廃棄物を削減し、資源を循環させるエコシステムとしての側面も持ち合わせます。

研究チームは今後、より堅牢な接続方法の採用や、ジェスチャー操作の統合を計画しています。将来的には、SF映画のように誰もがオンデマンドで必要なものを即座に手に入れられる世界の実現を目指し、モバイルロボットへの応用も視野に入れています。

NVIDIAとAWSがインフラ統合、AIチップ連携を強化

次世代チップとインフラの融合

AWS次世代チップTrainium4にNVLinkを統合
Blackwell搭載GPUAWSで提供拡大
両社技術の融合で計算性能と開発速度を最大化
AI産業革命に向けた計算ファブリックを共同構築

ソフトウェア高速化とデータ主権

Amazon BedrockでNemotronモデル利用可能
OpenSearch検索GPUで最大10倍高速化
データ主権を守るAWS AI Factories発表
ロボティクス向けCosmosモデルをAWSで提供

NVIDIAAmazon Web Services(AWS)は2025年12月2日、ラスベガスで開催中の「AWS re:Invent」において、戦略的パートナーシップの大幅な拡大を発表しました。この提携により、AWSの次世代AIチップ「Trainium4」とNVIDIAのインターコネクト技術「NVLink Fusion」が統合され、クラウドインフラの性能が飛躍的に向上します。両社はハードウェアだけでなく、ソフトウェアやロボティクス分野でも連携を深め、企業のAI導入を強力に支援します。

最大の目玉は、NVIDIAのスケールアップ技術とAWSのカスタムシリコンの融合です。AWSは「NVLink Fusion」を採用し、自社の推論・学習用チップ「Trainium4」やCPUと組み合わせます。これにより、大規模AIモデルの学習や推論のボトルネックを解消し、市場投入を加速します。NVIDIAジェンスン・フアンCEOは、この動きを「AI産業革命のための計算ファブリックの創造」と位置づけています。

データセキュリティと規制順守を重視する企業向けに、「AWS AI Factories」も発表されました。これは、NVIDIAの最新GPU「Blackwell」アーキテクチャを搭載したインフラを、顧客自身のデータセンター内に配備し、AWSが運用管理を行うサービスです。これにより、企業は機密データの主権(ソブリンAI)を維持しながら、世界最高峰のAI計算能力を活用することが可能になります。

開発者生産性を高めるソフトウェア統合も進みます。NVIDIAのオープンモデル「Nemotron」が「Amazon Bedrock」に統合され、即座に利用可能になりました。「Amazon OpenSearch Service」ではGPU活用のベクトル検索が導入され、最大10倍の高速化を実現しています。さらに、ロボティクス開発を支援する物理AIモデル「NVIDIA Cosmos」もAWS上で利用可能となりました。

NVIDIA、思考する自動運転AIと物理AI開発基盤を公開

自動運転を変える「思考するAI」

世界初の自動運転向け推論VLAモデル
思考の連鎖人間並みの判断を実現
研究用にGitHub等でオープン提供

物理AI開発を加速するツール群

開発全工程を網羅したCosmos Cookbook
ロボット動作生成やデータ修復に対応
音声AIや安全性モデルも拡充

2025年12月、米NVIDIAはAIカンファレンス「NeurIPS」において、自動運転および物理AI(Physical AI)向けのオープンソースモデル群を発表しました。特に注目されるのは、推論能力を持つ自動運転用VLAモデル「Alpamayo-R1」と、物理AI開発ガイド「Cosmos Cookbook」です。同社はこれらの技術を開放することで、ロボティクスや自動運転分野におけるイノベーションの加速を狙います。

NVIDIA DRIVE Alpamayo-R1」は、視覚情報の処理と言語による推論を統合し、行動決定を行う世界初のモデルです。最大の特徴は「思考の連鎖(Chain-of-thought)」を組み込んだ点にあり、歩行者の多い交差点や不規則な交通状況でも、人間のような常識に基づいた判断を下せます。これにより、完全自動運転(レベル4)の実現に向けた安全性が飛躍的に向上します。

物理AIの実装を支援するため、データ生成からモデル評価までの手順を示した「Cosmos Cookbook」も提供されます。開発者はLiDARデータの生成やロボットの動作ポリシー策定など、複雑なタスクに対応した「Cosmos」モデル群を容易に活用できるようになります。ジェンスン・フアンCEOが提唱する「AIの次の波は物理AI」というビジョンを具現化する動きです。

デジタルAI領域でも、複数話者の聞き分けが可能な音声モデルや、AIの安全性を担保するデータセット、推論速度と精度を両立する軽量モデルなどが公開されました。NVIDIAは70本以上の論文を発表しており、ハードウェアだけでなく、次世代AI開発に不可欠なソフトウェア基盤においても、圧倒的な存在感を示しています。

AnthropicのAI、ロボット犬の遠隔操作に成功

AIによるロボット制御実験

AI「Claude」によるロボット犬の制御
ロボティクス未経験者によるプログラミング
Claude利用群と非利用群で能力を比較

実験で判明したこと

Claude利用群がタスクを高速化
非利用群には達成不能なタスクも成功
チームの共同作業にも好影響

今後の展望とリスク

AIの物理世界への進出が加速
AIの自律的な身体化リスクへの備え

AI開発企業Anthropic社は、同社のAIモデル「Claude」がロボット犬のプログラミングと物理的なタスク実行を自動化できることを示す研究「Project Fetch」の結果を発表しました。この実験は、AIがデジタル空間だけでなく、物理世界へ影響を及ぼす「エージェント」としての能力を証明するものです。生産性向上の可能性を示す一方、将来的なリスクへの備えの重要性も浮き彫りにしています。

実験では、ロボティクスの専門知識がない2つの研究者チームが、中国Unitree社製の四足歩行ロボット「Go2」の操作に挑みました。片方のチームのみがClaudeの支援を受け、もう一方はAIなしでプログラミングを行いました。その結果、Claudeを利用したチームは、AIなしのチームが達成できなかった「ビーチボールを見つける」といった複雑なタスクを成功させ、作業をより迅速に完了させました。

今回の研究で注目すべきは、生産性以外の効果です。Anthropic社の分析によると、Claudeを利用したチームは、AIの支援なしで作業したチームに比べて、混乱や否定的な感情が少なく、より円滑に協力できていたことが判明しました。これは、Claudeロボットとの接続やインターフェースのコーディングを簡略化し、人間がより本質的な課題に集中できたためと考えられます。

Anthropic社は、AIの潜在的な危険性を研究し、安全な開発を推進することを目的に設立された企業です。今回の実験も、将来AIが自律的に物理システムを操作する「自己身体化」の可能性に備えるという、リスク研究の一環です。現行モデルがロボットを完全に制御する能力はありませんが、将来の高性能モデルがもたらす変化に先手を打つ狙いがあります。

専門家は、AIがロボットを操作する能力自体は驚くべきことではないとしながらも、AI支援がチームの力学に与える影響についての分析は注目に値すると評価しています。同時に、AIによるロボット制御は悪用や予期せぬ事故のリスクもはらみます。そのため、AIの行動に特定のルールを課す「RoboGuard」のような安全システムの開発も重要性を増しています。

AIがウェブ上の操作だけでなく、物理的な行動を起こすエージェントへと進化する未来は、すぐそこまで来ています。製造、建設、警備など、様々な産業でロボットの活用が進む中、AIによる自律制御は革命的な生産性向上をもたらすでしょう。しかし、その力をいかに安全に活用するか。経営者エンジニアにとって、この問いへの備えがこれまで以上に求められます。

テスラ、マスク氏の1兆ドル報酬案を承認 AI・ロボット化加速へ

巨額報酬案の概要

CEOへの史上最大級の報酬
時価総額8.5兆ドルへの挑戦
ロボタクシー100万台の稼働
人型ロボット100万台の販売

承認の背景と課題

マスクCEOの指導力維持が目的
株主の75%以上が賛成票
売上減速など事業環境は厳化
一部大株主や助言会社は反対

電気自動車(EV)大手のテスラは2025年11月6日、オースティンで開いた株主総会で、イーロン・マスク最高経営責任者(CEO)に対する新たな巨額報酬案を承認しました。75%以上の賛成票を得たこの決定は、同社のAIやロボティクス事業への転換を加速させるため、マスク氏のリーダーシップを確保する狙いがあります。

承認された報酬案は、マスク氏に野心的な目標達成を課すものです。今後10年間で、テスラの時価総額を現在の1.5兆ドルから8.5兆ドルへと引き上げることが求められます。さらに、100万台のロボタクシー稼働や100万体の人型ロボット販売なども条件に含まれており、達成すればマスク氏の株式保有比率は約25%に上昇します。

取締役会は、報酬案を承認しなければマスク氏が他の事業に注力し、テスラを離れるリスクがあると警告していました。テスラが単なる自動車メーカーではなく、AIとロボティクスのリーダーになるためには、マスク氏の強力な指導力が不可欠であるというメッセージを株主に訴え、支持を取り付けた形です。

この報酬案には、一部から強い反対もありました。ノルウェーの政府系ファンドなど一部の大株主や、大手議決権行使助言会社が反対を表明。また、以前の500億ドル超の報酬案がデラウェア州の裁判所で無効とされた経緯もあり、司法判断との整合性を問う声も上がっていました。

テスラは現在、売上の急減や中国メーカーとの競争激化など、厳しい事業環境に直面しています。投入したロボタクシーサービスは事前の期待を下回り、新型車「サイバートラック」の販売も苦戦しています。壮大な目標達成への道のりは、決して平坦ではないとの見方が広がっています。

OpenAI、210兆円投資も政府の救済は不要

巨額の投資計画

今後8年で1.4兆ドル投資
年間経常収益は200億ドル
2030年に数千億ドル規模へ

政府保証をめぐる騒動

CFOが政府の融資保証を要請
CEOは「政府保証は不要」と否定
市場競争での自立経営を強調

未来の収益源

エンタープライズ向けサービス
コンシューマー向けAIデバイスロボット
AIクラウドの直接提供

OpenAIサム・アルトマンCEOは11月6日、X(旧Twitter)への投稿で、同社の年間経常収益(ARR)が200億ドルを超え、今後8年間で約1.4兆ドル(約210兆円)のインフラ投資を計画していると明かしました。同時に、経営幹部が求めた政府による金融支援を明確に否定し、市場競争における自立経営の姿勢を強調しました。

アルトマン氏はなぜ政府の支援を拒んだのでしょうか。同氏は「政府は勝者や敗者を選ぶべきではなく、納税者は事業判断を誤った企業を救済すべきではない」との信念を表明。AI開発の熾烈な競争は、あくまで市場原理の中で勝ち抜くべきだという強い意志を示しました。唯一の例外として、米国内の半導体工場建設支援には協力する姿勢を見せています。

この発言の背景には、同社のサラ・フライヤーCFOによる「失言」がありました。同氏は金融イベントで、巨額のインフラ投資に対する政府の融資保証(バックストップ)を求めると発言。この発言が「納税者にリスクを負わせるのか」と批判を浴び、すぐさま撤回に追い込まれる事態となっていました。

1.4兆ドルという天文学的な投資は、同社の急成長が可能にすると見られています。今年の年間経常収益は200億ドル(約3兆円)を超える見込みで、2030年までには数千億ドル規模への成長を目指すとしています。この力強い収益力が、巨大な先行投資を支える基盤となります。

では、具体的にどう収益を拡大するのでしょうか。アルトマン氏は、既存のエンタープライズ向けサービスに加え、コンシューマー向けAIデバイスロボティクス、さらには「AIクラウド」としてコンピューティング能力を他社に直接提供する事業構想を明らかにしました。多角的な収益源の確保を急いでいます。

今回の一連の騒動は、OpenAIの並外れた野心と、それを自力で成し遂げようとする強い独立志向を浮き彫りにしました。AI業界の覇権をめぐる競争が、新たな次元に突入したことを示す出来事と言えるでしょう。

独の産業革新へ、NVIDIAとテレコムがAIクラウド創設

データ主権守る巨大AI基盤

10億ユーロ規模の共同事業
ドイツ国内でデータを管理
欧州の産業競争力を強化
2026年初頭に稼働開始

最高峰技術とエコシステム

NVIDIA最新GPUを最大1万基
独テレコムがインフラ提供
SAP、シーメンス等が参画

半導体大手NVIDIAドイツテレコムは11月4日、ドイツ国内に世界初となる産業特化のAIクラウド「Industrial AI Cloud」を共同で設立すると発表しました。総額10億ユーロを投じ、2026年初頭の稼働を目指します。この提携は、ドイツのデータ主権を守りながら産業のデジタルトランスフォーメーションを加速させ、欧州の国際競争力を高めることを目的としています。

NVIDIAジェンスン・フアンCEOは、AIを稼働させるデータセンターを「現代版の工場」と表現し、知能を生み出す重要性を強調しました。このプロジェクトは、欧州企業が自国のデータ管理下で安全にAI開発を進める「ソブリンAI(データ主権AI)」の実現に向けた大きな一歩となります。

ミュンヘン近郊に新設される「AIファクトリー」には、NVIDIAの最新GPU「Blackwell」アーキテクチャを採用したシステムなどが最大10,000基搭載される計画です。ドイツテレコムは信頼性の高いインフラと運用を提供し、企業が大規模なAIモデルのトレーニングや推論を高速かつ柔軟に行える環境を整えます。

この構想には、ソフトウェア大手SAPや製造業大手シーメンスなど、ドイツを代表する企業がエコシステムパートナーとして参画します。メルセデス・ベンツやBMWといった自動車メーカーも、AI駆動のデジタルツインを用いた複雑なシミュレーションでの活用を見込んでおり、幅広い産業での応用が期待されます。

具体的な活用例としては、製品開発を高速化するデジタルツイン、工場の自動化を進めるロボティクス、設備の故障を事前に予測する予知保全などが挙げられます。製造業の変革を促す「インダストリー4.0」をさらに加速させる起爆剤となるでしょうか。

今回の提携は、ドイツの国際競争力強化を目指す官民イニシアチブ「Made for Germany」から生まれた最初の具体的な成果の一つです。欧州では、外国の巨大テック企業への技術依存を減らしデジタル主権を確立する動きが強まっており、このAIクラウド欧州独自の技術革新の新たな核となる可能性を秘めています。

「アルトマンを選ぶ」著名記者がCEOを辛口採点

テックCEOへの評価

ザッカーバーグ氏との同乗は拒否
アルトマン氏の正常性を評価
マーク・キューバン氏は成熟
イーロン・マスク氏は悲しい存在

AIとシリコンバレー

AIは影響甚大な汎用技術
ロボティクスとAIの組合せが鍵
OpenAINetscapeかGoogle
シリコンバレー人を気にしない

米国の著名テックジャーナリスト、カラ・スウィッシャー氏がWIREDのインタビューに応じました。同氏はメタ社のザッカーバーグCEOよりOpenAIのアルトマンCEOの下で働きたいと述べ、テック業界のリーダー達を辛口に評価。AIの未来についても見解を示しました。

「誰とエレベーターに乗りたくないか」との問いに、ザッカーバーグ氏と即答。一方、アルトマン氏には「正常さの片鱗がある」と評価。自己の問題を理解している点で、両者を明確に対比しています。

他のリーダーにも言及。マスク氏を「悲しい存在」、クック氏には失望感を示しました。一方で、かつて傲慢だったマーク・キューバン氏が思慮深い人物に成熟したことは驚きだったと語ります。

シリコンバレーが自らにつく最大の嘘は「人々を気に掛けている」ことだと断じます。政治権力への迎合は、社会への義務感からではなく、株主価値を最優先する姿勢の表れだと指摘しました。

AIはあらゆる分野に及ぶ「汎用技術」だと重要性を強調。特に注目度の低いロボティクスとの組み合わせが社会を変える鍵になるとの見方を示しました。OpenAIGoogleのような存在になり得ると予測します。

一方で、若い世代には希望を見出しています。現在のリーダーとは異なり、彼らはコミュニティを助け、価値あるものを創るという純粋な理想を持っていると語ります。業界の未来は彼らにかかっているのかもしれません。

NVIDIA、韓国と提携 25万GPUで主権AI構築へ

官民挙げた国家プロジェクト

NVIDIA韓国官民が歴史的提携
最新GPU 25万基超を国家規模で導入
「主権AI」とAIファクトリーの構築
サムスン・現代など財閥企業が参画

主要産業のAI化を加速

製造・モビリティ分野の産業革新
韓国語LLMや次世代通信6Gも開発

半導体大手NVIDIAは2025年10月31日、韓国のAPEC首脳会議で、同国政府や主要企業と国家規模のAIインフラ構築で提携すると発表しました。サムスン電子などと連携し25万基以上の最新GPUを導入、韓国独自の「主権AI」開発を加速させます。国全体の産業基盤をAI時代に対応させる歴史的な投資となります。

プロジェクトの核心は、自国データを国内で管理・活用する「主権AI」の確立です。政府主導でクラウド事業者に約5万基GPUを、民間企業には20万基以上を供給。単なるインフラ整備に留まらず、国家の産業構造そのものをAI中心に再設計する壮大な構想です。

民間ではサムスン、SK、現代がそれぞれ最大5万基、NAVERは6万基以上のGPUを導入し「AIファクトリー」を構築します。これにより、製造、モビリティ、通信、ロボティクスといった基幹産業のデジタルトランスフォーメーションを根本から推進する計画です。

各社の狙いは明確です。サムスン半導体製造のデジタルツイン化、現代は自動運転とスマートファクトリー、SKは製造AIクラウド、NAVERは特定産業向けAIモデルの開発を推進。NVIDIAの技術で各社の競争力を飛躍的に高めます。

提携GPU導入に限りません。LGなども参加し、韓国語LLMの開発や量子コンピューティング研究、次世代通信「6G」に向けたAI-RAN技術の共同開発も推進。AIを核とした包括的な技術エコシステムの構築を目指します。

未来の成長を支えるため、スタートアップ支援と人材育成も強化します。NVIDIA韓国内のスタートアップ連合を設立し、インフラへのアクセスやVCからの支援を提供。同時にAI人材育成プログラムも展開し、エコシステム全体の底上げを図ります。

今回の発表は、韓国が国を挙げて「AI産業革命」に乗り出す号砲です。ハードウェア導入からソフトウェア開発、人材育成まで包括的な国家戦略として展開されるこの取り組みは、世界のAI開発競争における韓国の地位を左右する一手となるでしょう。

豪州「AI国家」へ、NVIDIAがエコシステムを主導

シドニーにAI関係者1000人集結

テーマは「ソブリンAI
生成AIやロボティクスなど最新技術を議論
大手銀やCanvaなど業界リーダーが参加

豪州AIエコシステムの急成長

スタートアップVCの連携加速
量子コンピューティング分野も活況
HPCやVFXの強みをAIに活用

NVIDIAは先週、オーストラリアのシドニーで「NVIDIA AI Day」を開催し、1000人以上の開発者や研究者、スタートアップが集結しました。イベントでは、各国が自国のデータを管理・活用する「ソブリンAI」をテーマに、生成AIやロボティクスなどの最新動向が議論されました。NVIDIAインフラ提供やパートナーシップを通じて、オーストラリアのAIエコシステム構築を強力に後押しし、同国をAI分野の世界的リーダーへと押し上げる構えです。

今回のイベントは、オーストラリアにおけるAIの可能性を明確に示しました。コモンウェルス銀行の最高情報責任者は「次世代のコンピュートがAIを牽引している」と述べ、NVIDIAが同国のAIエコシステム構築に貢献していることを高く評価。金融サービスから公共部門まで、幅広い業界でAIによるデジタルトランスフォーメーションが加速している現状が浮き彫りになりました。

エコシステムの中核を担う企業の動きも活発です。オーストラリア発のデザインプラットフォーム大手Canvaは、NVIDIAの技術を活用して数億人のユーザー向けに生成AIソリューションを開発している事例を紹介。同社のエンジニアリング担当シニアディレクターは「NVIDIAの技術を広範に活用し、AI機能をユーザーに提供している」と語り、具体的な協業の成果を強調しました。

未来の成長を担うスタートアップの育成にも力が注がれています。NVIDIAは今回、スタートアップベンチャーキャピタルVC)、パートナー企業を一堂に集めるネットワーキングイベントを初開催。量子コンピューティングや医療AIなど多様な分野の新興企業が登壇し、自社の技術を披露しました。地域のAI戦略を推進し、セクターを超えた協業を創出する絶好の機会となりました。

NVIDIAは、オーストラリアが持つ強みをAI時代の成長エンジンと見ています。同社の現地法人の責任者は「高性能コンピューティング(HPC)やVFXで培った専門知識と、活気ある量子・ロボティクス産業の融合が鍵だ」と指摘。強力な官民連携と世界クラスのインフラを武器に、オーストラリアAIによる経済発展の世界的リーダーになる未来像を描いています。

Google主催会議、AIが拓く未来の生産性を探る

世界のリーダー200人超が集結

Google主催の年次会議
カリフォルニア州で開催
ビジネス、科学、芸術の第一人者

AIが牽引する未来の生産性

AIによる生産性向上を議論
GoogleのAI量子研究所を公開
ロボティクス核融合も焦点

ヘルスケアから経済まで議論

CRISPRとAIによる医療革新
著名経済学者による経済討論

Googleは2025年10月22日、カリフォルニア州で年次会議「Zeitgeist 2025」を開催しました。18回目となる今回は、ビジネス、科学、技術、芸術の各分野から200人以上のグローバルリーダーが集結。AIを活用した生産性向上や、イノベーションを通じて地球規模の課題をいかに解決できるかについて、2日間にわたり活発な議論が交わされました。

会議の最大の焦点は、AIがもたらす未来の生産性でした。参加者はGoogleのAI量子研究所を視察したほか、ロボティクスや核融合エネルギーが次世代の成長を牽引する可能性について議論。未来の産業を形作る最先端技術の動向に、大きな関心が寄せられました。

ヘルスケア分野も重要な議題となりました。ゲノム編集技術CRISPR-Cas9の共同開発者であるジェニファー・ダウドナ氏らが登壇し、ゲノム編集とAIの融合がもたらす医療のブレークスルーについて議論。個別化医療や難病治療への応用が期待される革新的なアプローチが紹介されました。

経済やビジネスの未来に関するセッションも注目を集めました。著名な経済学者であるモハメド・エラリアン氏やマイケル・スペンス氏らが世界経済の動向を分析。また、ライフスタイルブランドの創設者マーサ・スチュワート氏とGoogleのCFOルース・ポラット氏が起業家精神について語り合いました。

この会議は、単なる技術カンファレンスではありません。富と目的、海洋保護といった多様なテーマが取り上げられ、分野を超えたアイデア交換とパートナーシップ構築の場となりました。Zeitgeistは、次なる時代精神を形作るための重要なフォーラムとしての役割を改めて示しました。

ヒューマノイド投資に警鐘、実用化への高い壁

立ちはだかる技術的な壁

人間の手のような器用さの習得
60自由度を超える複雑なシステム制御
デモはまだ遠隔操作の段階も

市場と安全性の現実

人間と共存する際の安全確保が課題
宇宙など限定的なユースケース
VCが懸念する不透明な開発計画

iRobot創業者のロドニー・ブルックス氏をはじめとする複数の専門家が、ヒューマノイドロボット分野への過熱投資に警鐘を鳴らしています。巨額の資金が投じられる一方、人間の手のような「器用さ」の欠如や安全性の懸念から、実用化はまだ遠いとの見方が大勢です。広範な普及には、少なくとも数年から10年以上かかると予測されています。

最大の課題は、人間の手のような繊細な動き、すなわち「器用さ」の習得です。ブルックス氏は、現在の技術ではロボットがこの能力を学習することは極めて困難であり、これができなければ実質的に役に立たないと指摘します。多くのデモは華やかに見えますが、実用レベルには達していないのが現状です。

人間と共存する上での安全性も大きな障壁です。ロボティクス専門のベンチャーキャピタルは、工場や家庭内でヒューマノイドが人に危害を加えるリスクを懸念しています。ロボットの転倒による事故や、ハッキングされて予期せぬ行動を取る危険性など、解決すべき課題は山積しています。

開発のタイムラインも不透明です。Nvidiaの研究者は、ヒューマノイド開発の現状をかつての自動運転車の熱狂になぞらえています。実用化までには想定以上に長い年月を要する可能性があり、これは投資家の回収サイクルとも合致しにくく、ビジネスとしての持続可能性に疑問を投げかけています。

期待の大きいテスラの「Optimus」でさえ、開発は遅れ、最近のデモでは人間が遠隔操作していたことが明らかになりました。高い評価額を受けるスタートアップFigureも、実際の配備数については懐疑的な目が向けられており、期待と現実のギャップが浮き彫りになっています。

もちろん、専門家ヒューマノイドの未来を完全に否定しているわけではありません。しかし、その登場は10年以上先であり、形状も人型ではなく車輪を持つなど、より実用的な形になる可能性が指摘されています。現在の投資ブームは、技術の成熟度を見誤っているのかもしれません。

ソフトバンク、54億ドルでABBロボティクス買収 Physical AIを新フロンティアに

Physical AIへの大型投資

買収額は約54億ドル(53.75億ドル)
買収対象はABBグループのロボティクス事業部門
孫正義CEO「次なるフロンティアはPhysical AI」
2026年中旬から下旬買収完了見込み

成長戦略「ASIと融合」を加速

AIチップ・DC・エネルギーと並ぶ注力分野
産業用ロボット分野での事業拡大を再加速
従業員約7,000人、幅広いロボット製品群を獲得
既存のロボティクス投資群との相乗効果を追求

ソフトバンクグループは10月8日、スイスの巨大企業ABBグループのロボティクス事業部門を約53.75億ドル(約8,000億円超)で買収すると発表しました。これは、孫正義CEOが掲げる次なる成長分野「Physical AI(フィジカルAI)」戦略を具現化する大型投資です。規制当局の承認を経て、2026年中旬から下旬に完了する見込みです。

今回の買収は、ソフトバンクが「情報革命」の次なるフェーズとしてAIに集中投資する姿勢を明確に示しています。孫CEOは、「Physical AI」とは人工超知能(ASI)とロボティクスを融合させることであり、人類の進化を推進する画期的な進化をもたらすと強調しています。過去の失敗例を超え、AIを物理世界に実装する試みを加速させます。

買収対象となるABBのロボティクス事業部門は、約7,000人の従業員を抱え、ピッキングや塗装、清掃など産業用途の幅広いロボット機器を提供しています。2024年の売上は23億ドルでしたが、前年比で減少傾向にありました。ソフトバンクは、この部門の販売を再活性化させ、成長軌道に乗せることを目指しています。

ソフトバンクは現在、ロボティクスを最重要視する四つの戦略分野の一つに位置づけています。残りの三分野は、AIチップ、AIデータセンターエネルギーです。この大型投資は、AIインフラ全体を支配し、ASIを実現するという孫氏の壮大なビジョン達成に向けた、重要な布石となります。

ソフトバンクはすでに、倉庫自動化のAutoStoreやスタートアップのSkild AI、Agile Robotsなど、様々なロボティクス関連企業に投資しています。今回のABB買収により、既存のポートフォリオとの相乗効果が期待されます。特に、高性能な産業用ロボット技術とAI知能を結びつけることで、競争優位性を確立する狙いです。

MITとMBZUAIが5年協定、AI基盤強化と地球課題解決へ

連携の核心

AIの基盤強化と応用促進
期間は5年間の国際共同研究

共同研究の重点領域

科学的発見の加速
人間の繁栄への貢献
地球の健康(持続可能性)

プログラム運営体制

研究資金はMBZUAIが支援
両大学から共同責任者を任命
研究成果はオープン公開を原則

マサチューセッツ工科大学(MIT)のシュワルツマン・コンピューティング・カレッジは、ムハンマド・ビン・ザーイド人工知能大学(MBZUAI、アラブ首長国連邦)との5年間にわたる共同研究プログラムを正式に開始しました。この連携は、AIの技術的基盤を強化するとともに、喫緊の科学的・社会的課題への応用を加速させることを目的としています。国際的なトップレベルの頭脳が結集し、次世代AIの方向性を定める動きとして注目されます。

本プログラムでは、教員や研究者、学生が連携し、主に三つの核となる領域で基礎研究を推進します。それは「科学的発見の加速」「人間の繁栄への貢献」、そして「地球の健康(環境問題や持続可能性)」です。MIT側は「AIが責任ある、包括的かつ世界的に影響力のある形で進化する」という共通のコミットメントを強調しています。

MBZUAIのエリック・シン学長は、この提携が「トランスコンチネンタル(大陸横断的)な発見の橋」を築くと述べています。AI専用の大学であるMBZUAIが持つ基盤モデル実世界への展開力と、MITが誇る計算科学と学際的なイノベーションの深さを融合させます。これにより、ブレークスルーが人間の健康改善やインテリジェント・ロボティクスなどに直結することが期待されます。

このプログラムは、AI科学を通じた進歩を専門とするアブダビ拠点のMBZUAIからの資金支援を受けて運営されます。毎年多数の共同プロジェクトが資金提供を受け、両大学から選出された運営委員会が研究テーマを決定します。さらに重要な点として、研究成果は原則としてオープンに公開可能であり、広範な知識共有を促進する方針です。

Google AI、コア製品を劇的進化 9月のChrome/Search/Gemini刷新まとめ

コア製品のAI統合

ChromeGeminiブラウジングアシスタント搭載
Searchにリアルタイム視覚検索(Search Live)導入
複雑な多段階質問に対応するAIモードの拡充
Android Gboardにトーン修正・文法校正AI

Geminiと次世代技術

カスタムAI「Gems」の共有機能でコラボを促進
Nano Bananaによる高度な画像生成・編集機能

Googleは2025年9月、AI技術を中核製品全体に深く統合し、利用者体験の劇的な向上を発表しました。これはChrome、Search、Geminiアプリといった主要サービスに留まらず、教育分野や次世代ロボティクスまで多岐にわたります。特に、生産性向上に直結する機能が多数リリースされており、AIを使いこなしたい経営者エンジニア層にとって見逃せないアップデートです。

ウェブブラウザと検索機能は、AIアシスタント化を加速させています。ChromeではGeminiがブラウジングアシスタントとして機能し、開いているタブ全体を横断して質問に回答可能です。また、SearchのAIモードは、複雑な多段階質問に対応するだけでなく、日本語を含む多言語対応を拡大し、グローバルでの利用を促進しています。

特に画期的なのは、Search Liveの導入です。これは、リアルタイムの音声会話にスマートフォンのカメラフィードを共有する機能を組み合わせ、現実世界の課題解決をリアルタイムで支援します。また、AndroidのGboardにはAIライティングツールが追加され、トーンの修正やスペル・文法の校正が端末内で自動で行えるようになり、モバイル生産性が向上しました。

GeminiアプリはAI活用ハブとしての地位を固めています。特に、特定の目的に合わせてカスタマイズしたAIモデル「Gems」の共有機能が追加され、チーム内での共同作業や情報共有が容易になりました。さらに、DeepMind開発の画像生成・編集モデル「Nano Banana」の活用が広がり、クリエイティブな作業の可能性を広げています。

学習領域では、AIが個々のユーザーに最適化された学習を実現します。NotebookLMは、利用者のメモに基づきフラッシュカードやクイズを自動生成し、パーソナライズされた学習ガイドを提供します。スンダー・ピチャイCEOはAI教育への10億ドルのコミットメントを強調し、「Gemini for Education」を全米の高校に提供すると発表しました。

長期的な視点では、Google DeepMindが「物理エージェント」の時代を宣言し、ロボティクスモデルを強化しました。Gemini Robotics 1.5/ER 1.5は、ロボットが環境を認識し、推論し、複雑なマルチステップタスクを処理する能力を飛躍的に高めます。また、Gemini 2.5が国際プログラミングコンテストで金メダル級の成績を収め、その推論能力を証明しています。

AI開発の主戦場、「ワールドモデル」へ移行加速

LLMの次なるフロンティア

LLMの性能向上に頭打ち感
物理世界を理解する新モデルに注目
動画ロボットデータから学習
GoogleMetaNvidiaが開発を主導

100兆ドル市場への期待と課題

自動運転やロボティクス進化を加速
製造・医療など物理領域への応用
Nvidia幹部が100兆ドル市場と試算
実現には膨大なデータと計算能力が壁

Google DeepMindMetaNvidiaなどの大手AI企業が、大規模言語モデル(LLM)の進歩が鈍化する中、次なる飛躍を求めて「ワールドモデル」の開発に注力し始めています。この新モデルは、言語データではなく動画ロボットデータから物理世界を学習し、人間環境への深い理解を目指します。これは機械による「超知能」実現に向けた新たなアプローチとして注目されています。

OpenAIChatGPTなどに代表されるLLMは、目覚ましい進化を遂げてきました。しかし、各社が投入する最新モデル間の性能差は縮小傾向にあり、開発に投じられる莫大な資金にもかかわらず、進歩に頭打ち感が見え始めています。この状況が、AI開発の新たな方向性を模索する動きを加速させているのです。

ワールドモデルは、LLMとは根本的に異なるアプローチを取ります。テキストデータから言語のパターンを学ぶLLMに対し、ワールドモデル動画シミュレーションロボットの動作データといった物理世界のデータストリームから学習します。これにより、現実世界の法則や因果関係を理解し、将来を予測する能力の獲得を目指します。

この技術が秘める経済的インパクトは計り知れません。Nvidiaの担当副社長であるレヴ・レバレディアン氏は、ワールドモデルが物理世界を理解し操作できるようになれば、その潜在市場は「本質的に100兆ドル」規模、つまり世界経済に匹敵する可能性があると指摘しています。

ワールドモデルは、自動運転車やロボティクス、いわゆる「AIエージェント」の進化に不可欠な一歩と見なされています。製造業やヘルスケアなど、物理的な操作を伴う産業での活用も期待されます。しかし、その実現には膨大なデータと計算能力が必要であり、依然として技術的に未解決の挑戦であることも事実です。

Meta、ロボットOSで覇権狙う AR級の巨額投資

ボトルネックはソフトウェア

ARに次ぐ数十億ドル規模投資
ハードウェアではなくソフトウェアが開発の鍵
器用な操作を実現するAIモデルが不可欠

「ロボット界のAndroid」構想

自社製ロボットMetabot」も開発
他社へソフトウェアをライセンス供与
プラットフォームで業界標準を狙う

専門家集団による開発体制

元Cruise CEOがチームを統括
MITなどからトップ人材を結集

Metaは、ヒューマノイドロボット開発を拡張現実(AR)に次ぐ大規模な投資対象と位置付けていることを明らかにしました。同社のアンドリュー・ボスワースCTOによると、数十億ドル規模を投じ、ハードウェアではなくソフトウェア開発に注力します。開発したプラットフォームを他社にライセンス供与する「ロボットAndroid」とも言える戦略で、急成長する市場の主導権を握る構えです。

なぜソフトウェアが重要なのでしょうか。ボスワース氏は「ハードウェアは難しくない。ボトルネックはソフトウェアだ」と断言します。ロボットがコップを絶妙な力加減で掴むといった器用な操作は極めて困難であり、この課題を解決するため、AIが現実世界をシミュレーションする「ワールドモデル」の構築が不可欠だと説明しています。

Metaの戦略は、自社でハードウェアを製造し販売することではありません。社内で「Metabot」と呼ばれるロボットを開発しつつも、その核心技術であるソフトウェアを他社ロボットメーカーに広くライセンス供与する計画です。これはGoogleAndroid OSでスマートフォン市場のエコシステムを築いた戦略と類似しており、オープンなプラットフォームで業界標準となることを目指します。

この野心的な計画を支えるのが、Metaが新設した「Superintelligence AI lab」です。このAI専門組織がロボティクスチームと緊密に連携し、ロボット知能を司るAIモデルを開発します。ボスワース氏は「このAIラボがなければ、このプロジェクトは実行しなかった」と述べ、AI開発能力が自社の最大の強みであるとの認識を示しました。

このアプローチは、テスラが開発する「Optimus」とは一線を画します。ボスワース氏は、人間の視覚を模倣してデータを集めるテスラの手法について「ロボット用のデータをどうやって十分に集めるのか疑問だ」と指摘。Metaシミュレーションワールドモデルを駆使して、このデータ問題を解決しようとしています。

Metaの本気度は、集結した人材からも伺えます。自動運転企業Cruiseの元CEOであるマーク・ウィッテン氏がチームを率い、MITから「現代最高の戦術ロボット工学者」と評されるキム・サンベ氏を招聘。社内のトップエンジニアも結集させ、盤石な体制でこの巨大プロジェクトに挑みます。

アリババ、NVIDIAと提携し物理AI開発基盤を導入

中国の電子商取引大手アリババは24日、米半導体大手NVIDIAとの提携を発表しました。NVIDIAが提供するロボットや自動運転向けの物理AI開発ツールを、自社のAIクラウドプラットフォームに統合します。この提携は、物理世界で動作するAIの開発を加速させることが目的です。 具体的には、NVIDIAの「Physical AI」ソフトウェアスタックを顧客に提供します。これにより開発者は、現実世界の環境を忠実に再現した3Dのデジタルツインを構築できます。この仮想空間で生成された合成データを用いることで、AIモデルを効率的かつ安全に訓練することが可能になります。 この技術は、特にロボティクスや自動運転車、スマート工場、倉庫といった分野での活用が期待されています。現実世界でのテストが困難または危険なシナリオでも、仮想環境でAIを訓練できるため、開発サイクルが大幅に短縮される可能性があります。 今回の提携は、AI事業を強化するアリババの戦略の一環です。同社はAI技術への投資を従来の500億ドルの予算を超えて拡大すると表明。ブラジルやフランスなどでデータセンターを新設し、世界91拠点にまでインフラを拡大する計画も明らかにしました。 アリババは同日、最新の大規模言語モデル(LLM)「Qwen 3-Max」も発表しました。1兆パラメータで訓練されたこのモデルは、同社史上最大かつ最も高性能とされ、特にコーディングやAIエージェントとしての活用に適していると主張しています。 一方のNVIDIAも、AI分野で積極的な投資を続けています。最近ではインテルへの50億ドルの出資や、OpenAIへの最大1000億ドルの投資計画を発表しており、AIエコシステムにおける影響力を一層強めています。

ロボットデータ基盤Alloy、約300万ドル調達で市場開拓

オーストラリアスタートアップAlloyは23日、ロボットが生成する膨大なデータを管理するインフラ開発のため、約300万ドル(約4.5億豪ドル)をプレシードラウンドで調達したと発表しました。このラウンドはBlackbird Venturesが主導しました。同社は、自然言語でデータを検索し、エラーを発見するプラットフォームを提供することで、ロボティクス企業の開発効率向上を目指します。今後は米国市場への進出も計画しています。 あなたの会社では、ロボットが生成する膨大なデータをどう管理していますか。ロボットは1台で1日に最大1テラバイトものデータを生成することがあります。カメラやセンサーから常にデータが送られるためです。多くの企業は、この膨大なデータを処理するために既存のツールを転用したり、内製ツールを構築したりしており、非効率なデータ管理が開発の足かせとなっています。 Alloyは、ロボットが収集した多様なデータをエンコードし、ラベル付けします。利用者は自然言語でデータを検索し、バグやエラーを迅速に特定できます。ソフトウェア開発の監視ツールのように、将来の問題を自動検知するルールを設定することも可能で、開発の信頼性向上に貢献します。これにより、エンジニアは数時間に及ぶデータ解析作業から解放されるのです。 創業者のジョー・ハリスCEOは、当初農業用ロボット企業を立ち上げる予定でした。しかし、他の創業者と話す中で、業界共通の課題がデータ管理にあると気づきました。自身の会社のためにこの問題を解決するよりも、業界全体のデータ基盤を整備する方が重要だと考え、2025年2月にAlloyを設立しました。 Alloyは設立以来、オーストラリアロボティクス企業4社とデザインパートナーとして提携しています。今回の調達資金を活用し、年内には米国市場への本格的な進出を目指します。まだ直接的な競合は少なく、急成長するロボティクス市場で、データ管理ツールのデファクトスタンダードとなることを狙っています。 ハリス氏は「今はロボティクス企業を設立するのに最高の時代だ」と語ります。同氏は、今後生まれるであろう数多くのロボティクス企業が、データ管理という「車輪の再発明」に時間を費やすことなく、本来のミッションに集中できる世界を目指しています。このビジョンが投資家からの期待を集めています。

OpenAI、人型ロボット開発を強化 AGI競争の新局面へ

AI開発をリードするOpenAIが、AGI(汎用人工知能)実現に向けた次の一手として人型ロボット開発を本格化させています。同社は最近、人型ロボット向けAIシステムの専門研究者の採用を開始しました。これは、物理世界でタスクを実行する能力がAGI開発の鍵になるとの認識が業界で高まっていることを示唆します。TeslaやFigure AIなど先行企業との競争が激化しそうです。 なぜ今、人型ロボットなのでしょうか。その理由は、ロボットが人間用に設計された環境で活動できる点にあります。階段を上るなど物理的なタスクを通じた学習が、より高度な知能の獲得につながると考えられています。文章生成は得意でも「コーヒーを淹れる」ことができない現在のAIの限界を超える狙いです。 OpenAIは2021年にロボティクス部門を一度閉鎖しましたが、再びこの分野に注力し始めました。AIの次なるブレークスルーとして、物理世界を理解する「ワールドモデル」の構築が重要視されています。ロボット開発はその鍵を握るプロジェクトと位置づけられているのです。 人型ロボット市場では、すでに多くの企業が開発競争を繰り広げています。TeslaやFigure AI、Boston Dynamicsなどが有力なプレイヤーです。中国のUnitreeは低コストなロボットで市場に参入。OpenAIは先行するハードウェア企業に対し、得意のAIアルゴリズムで優位性を築く戦略です。 人型ロボット市場は2050年までに5兆ドル規模に達するとの予測もあり、期待が高まっています。しかし、SNSで目にする見事なデモ動画は、特定の条件下でしか成功しない場合も少なくありません。未知の環境で安定して動作する信頼性の確保が、実用化に向けた最大の課題と言えるでしょう。 実用化はまず、工場や倉庫といった産業現場から進む見通しです。Amazonは倉庫内で、現代自動車は工場で人型ロボットの試験導入を開始しています。危険で単調な作業の代替が主な目的です。各家庭で活躍する「ロボット執事」の実現はまだ先になりそうです。 今後の技術的な焦点は、ハードとソフトの両面にあります。人間の手のように繊細な作業をこなすハードウェアは依然として難題です。また、未知の状況にも対応できる汎用的なAIモデルも欠かせません。AIの「幻覚」が物理世界で起きないよう、安全性と信頼性の確保が最優先されます。

ロボットの安全性向上へ 3D超音波センサー「ADAR」が6億円調達

新世代の<span class='highlight'>知覚技術</span>

人間空間に進出するロボット安全確保
高周波音波(ADAR)による3D空間把握
LiDARより安価かつ高性能な代替策

LiDARとの<span class='highlight'>優位性</span>

レーザー点状測定に対し空間全体を充填
カメラの弱点を補う高精度な深度知覚
業界標準フォーマットで多様なシステムに連携

<span class='highlight'>市場からの評価</span>

ロボティクス産業安全分野で需要拡大
スケールアップに向け600万ドル調達完了

Sonairは、ロボットの安全性向上を目的とした3D超音波センサー「ADAR (Acoustic Detection and Ranging)」の開発資金として、600万ドル(約9億円超)を調達しました。このオスロ拠点のスタートアップは、従来のLiDAR技術よりも安価かつ包括的に環境を認識できるソリューションを提供し、人間と協働するロボットの普及を加速させます。

ADARセンサーは、高周波の超音波を発信し、その反響を捉えることで周囲の3次元データを取得します。共同創業者兼CEOのサンドヴェン氏は、LiDARがレーザー点状測定であるのに対し、「部屋全体を音で満たす」イメージだと説明し、より信頼性の高い深度知覚を実現します。

ロボットの知覚は通常、カメラに大きく依存しますが、カメラは悪条件下での物体検出に課題があります。ADARは、他のセンサーやカメラでは捉えきれない、高精度な深度情報を提供することで、ロボットのオペレーティングシステムが環境をより正確に把握する手助けをします。

Sonairは今年初めにセンサーをリリースして以来、ロボティクス分野から強い需要を受けています。複数の企業が次期モデルへの組み込みを計画するほか、産業安全セクターでの活用も開始。重機エリアへの侵入者を検知し、自動で機械を停止させる安全対策に貢献しています。

自動運転車の初期と同様に、人型ロボットヒューマノイド)の普及に伴い、安全性が最大の懸念事項となることが確実視されています。投資家たちはこの課題を理解しており、Sonairはカメラのように全てのロボットに搭載される標準センサーとなることを目指しています。

NVIDIAが英国の「AIメーカー」戦略を加速 物理AI・創薬・ロボティクス分野で広範に連携

英国の国家AI戦略を支援

英国のAI機会行動計画を後押し
世界クラスの計算基盤への投資
AI採用を全経済分野で推進
AIユーザーでなくAIメーカーを目指す

重点分野での協業事例

スパコンIsambard-AI」で基盤構築
ロボティクス:自律走行、製造、ヒューマノイド開発
ライフサイエンス:AI創薬デジタルツインを活用

NVIDIA英国のAIエコシステムとの広範なパートナーシップを強調し、英国の国家戦略である「AIメーカー」としての地位確立を強力に支援しています。ジェンスン・ファンCEOの英国訪問に際し、物理AI、ロボティクス、ライフサイエンス、エージェントAIなど最先端領域における具体的な協業事例が公表されました。

英国のAI基盤強化の核となるのは、NVIDIA Grace Hopper Superchipsを搭載した国内最速のAIスーパーコンピューター「Isambard-AI」です。これにより、公的サービスの改善を目指す独自の多言語LLM(UK-LLM)や、早期診断・個別化医療に向けた医療基盤モデル(Nightingale AI)など、重要な国家プロジェクトが推進されています。

特に物理AIとロボティクス分野での応用が加速しています。Extend Roboticsは製造業向けに安全なロボット遠隔操作システムを開発。Humanoid社は倉庫や小売店向けの汎用ヒューマノイドロボットを開発しており、いずれもNVIDIAのJetsonやIsaacプラットフォームが活用されています。

ライフサイエンス分野では、AIによる創薬の加速が目覚ましいです。Isomorphic LabsはAI創薬エンジンを構築し、英国CEiRSIはNVIDIA技術を用いて複雑な患者のデジタルツインを作成。これにより、大規模かつ多様な患者集団に対する新しい治療法のテストを可能にしています。

エージェントAIおよび生成AIのイノベーションも活発です。Aveniは金融サービスに特化したLLMを開発し、コンプライアンスを確保しながら顧客対応やリスク助言を行うエージェントフレームワークを構築しました。ElevenLabsやPolyAIは、超リアルな音声生成や、大規模な顧客サポート自動化を実現しています。

また、AIスキルギャップ解消への取り組みも重要です。技術ソリューションプロバイダーのSCANは、NVIDIA Deep Learning Instituteと連携し、コミュニティ主導型のトレーニングプログラムを展開しています。これにより、英国全土でAIや専門的なワークロードに対応できる人材育成が進められています。

Hugging Face、ロボット学習用データの大規模ストリーミングに対応

V3.0の主要機能

数百万エピソード対応のスケーラビリティ向上
大容量データをダウンロード不要で処理可能
複数エピソードを単一ファイルに集約(ファイル数削減)
関係メタデータによるエピソード単位の検索

ロボティクスデータ対応

センサー運動、複数カメラフィードなどに対応
PyTorchとのシームレスな統合
時系列データを扱うためのネイティブなウィンドウ操作
実機からシミュレーションまで広範にサポート

Hugging Faceは、ロボット学習向けデータセットフォーマット「LeRobotDataset:v3.0」をリリースしました。これは、数百万エピソードに及ぶ超大規模なロボティクスデータの取り扱いを根本的に改善するものです。旧バージョンで課題だったファイルシステムの制約を克服し、大容量データをディスクにダウンロードせずに処理できるストリーミング機能にネイティブ対応しました。この進化は、ロボティクス分野におけるAI学習の民主化を大きく加速します。

V3.0の最大の設計上の変更点は、スケーラビリティの確保です。従来、エピソードごとにファイルを保存していたため、エピソード数が増加するとファイルシステムに過大な負荷がかかっていました。新フォーマットでは、複数のエピソードを単一のファイルに集約し、リレーショナルメタデータを用いてエピソード単位の情報を効率的に検索します。これにより、大規模データセットの管理が大幅に簡素化されました。

新たに導入されたストリーミング機能は、ロボット学習のアクセシビリティを劇的に向上させます。専用の`StreamingLeRobotDataset`インターフェースを利用することで、ユーザーはテラバイト級のデータをローカルにダウンロードすることなく、Hugging Face Hubから直接データバッチをオンザフライで処理できます。これは、特にリソースが限られた環境での研究開発に貢献します。

データは効率的な構造で保存されます。低次元のセンサーデータやアクションはApache Parquetファイルに、大量のカメラ映像はMP4ファイルに連結・エンコードされます。また、本フォーマットはHugging FaceとPyTorchのエコシステムに統合されており、ロボット学習特有の時系列データのウィンドウ処理(過去の観測のスタック)をネイティブにサポートしている点も特徴的です。

OpenAI、AGIへ「人型ロボットAI」開発を急加速

AGI実現への新経路

AGI実現へ物理世界での行動を重視
LLMの限界を認め新たな研究領域へ移行
人型ロボットAIの汎用化を目標に設定

開発体制と技術基盤

人型ロボット研究の専門家を積極採用
遠隔操作とシミュレーションで訓練
Nvidia Isaacなど開発環境を導入

ハード開発の可能性

試作・構築経験を持つ機械エンジニアを募集
量産化を視野に入れたハードウェア設計を示唆

OpenAIAGI(汎用人工知能)達成に向け、ロボティクス研究を本格的に再加速させています。特に、物理世界との相互作用を可能にする人型ロボットAIの開発に注力するため、スタンフォード大学などから専門家を積極的に採用していることが明らかになりました。これは、既存のLLMモデルの限界を超え、AIを次の段階へ進めるための戦略的な転換です。

同社は、AGIを実現するには、単なる対話や推論能力だけでなく、現実世界でタスクを実行できるアルゴリズムが必要だと判断しました。このため、大規模言語モデル(LLM)の発展がピークに達しつつあると見て、物理的な感覚や運動制御を伴う新たな研究分野に焦点を移しています。

採用された研究者たちは、人型や部分的に人型をしたロボットを制御するAIアルゴリズム開発の専門家です。求人情報からは、ロボットを人間が操作し、その動きをAIが学習するテレイグジスタンス(遠隔操作)シミュレーションを用いた訓練システムの構築を進めていることが分かります。

具体的には、ロボット訓練に広く使われるNvidia Isaacなどの仮想物理環境シミュレーション技術の専門知識が求められています。これにより、現実世界での試行錯誤コストを削減しつつ、AIが複雑な環境に適応する能力を効率的に獲得することが期待されます。

OpenAIが自社でロボットを製造するか、既存のハードウェアを活用するかは不明確です。しかし、求人には、センサー付きロボットシステムの試作・構築経験を持つ機械エンジニアの募集があり、量産(100万台以上)を前提とした設計経験も要求されており、ハードウェアへの深い関与を示唆しています。

このロボティクスへの再参入は、競争が激化する市場への挑戦です。すでにFigureやAgilityなどのスタートアップに加え、テスラGoogleといった巨大AI企業も人型ロボット開発に大規模な投資を行っています。現時点では、OpenAI「魔法のような優位性はない」との指摘もあり、今後の技術開発競争に注目が集まっています。