シミュレーション(ユースケース)に関するニュース一覧

AIエージェントの弱点露呈、マイクロソフトが実験場公開

AI市場シミュレータ公開

マイクロソフトが開発・提供
名称はMagentic Marketplace
AIエージェントの行動を研究
OSSとして研究者に公開

判明したAIの主な脆弱性

選択肢過多で性能が低下
意図的な情報操作に弱い
応答順など体系的な偏りも露呈

マイクロソフトは2025年11月5日、AIエージェントの市場行動を研究するためのシミュレーション環境「Magentic Marketplace」をオープンソースで公開しました。アリゾナ州立大学との共同研究で、GPT-5など最新モデルをテストした結果、選択肢が多すぎると性能が落ちる「選択のパラドックス」や、意図的な情報操作に対する深刻な脆弱性が明らかになりました。

今回の実験で最も驚くべき発見の一つは、AIエージェントが「選択のパラドックス」に陥ることです。選択肢が増えるほど、より良い結果を出すと期待されるのとは裏腹に、多くのモデルで消費者利益が低下しました。例えばGPT-5は、選択肢が増えると性能が最適値の2000から1400へ大幅に低下。これは、AIが持つコンテキスト理解の限界を示唆しています。

さらに、AIエージェントは情報操作に対しても脆弱であることが判明しました。偽の権威付けや社会的証明といった心理的戦術から、悪意のある指示を埋め込むプロンプトインジェクションまで、様々な攻撃をテスト。その結果、GPT-4oなどのモデルは、操作した事業者へ全ての支払いを誘導されてしまうなど、セキュリティ上の重大な懸念が浮き彫りになりました。

実験では体系的な偏り(バイアス)も確認されました。一部のオープンソースモデルは、検索結果の最後に表示された事業者を優先的に選択する「位置バイアス」を示しました。また、多くのモデルが最初に受け取った提案を安易に受け入れる「提案バイアス」を持っており、より良い選択肢を見逃す傾向がありました。こうした偏りは、市場の公正性を損なう恐れがあります。

「Magentic Marketplace」は、こうした複雑な問題を安全に研究するために開発されたプラットフォームです。現実世界では難しい、多数のエージェントが同時に相互作用する市場をシミュレートし、消費者保護や市場効率、公平性といった課題を検証できます。マイクロソフトは、この環境を研究者に開放することで、AIが社会に与える影響の解明を加速させたい考えです。

今回の研究結果は、AIエージェントの実用化にはまだ多くの課題があることを示しています。特に、重要な意思決定をAIに完全に委ねるのではなく、人間が監督する「ヒューマン・イン・ザ・ループ」の仕組みが不可欠です。企業がAIエージェントを導入する際には、こうした脆弱性を十分に理解し、対策を講じる必要があります。今後の研究開発の焦点となるでしょう。

NVIDIA、フィジカルAI設計図で都市DXを加速

フィジカルAI設計図とは

デジタルツインとAIを統合
現実世界をOmniverseで再現
合成データでAIモデルを訓練
リアルタイムの映像解析を実現

グローバルな都市での実装

交通管理やインフラ監視に活用
ダブリンやホーチミン市で導入
Esriなど多様なパートナーと連携
インシデント対応時間を80%削減

NVIDIAは、バルセロナで開催中の「スマートシティエキスポ」で、都市が抱える課題を解決する「フィジカルAIブループリント」を発表しました。この設計図は、デジタルツイン技術と最新のAIを組み合わせ、交通渋滞の緩和やインフラ管理の効率化を実現します。Esriやデロイトといったグローバルパートナーとの協業を通じて、すでに世界各国の都市で具体的な成果を上げています。

「フィジカルAIブループリント」の中核をなすのが、現実世界を仮想空間に忠実に再現するデジタルツイン技術「NVIDIA Omniverse」です。ここに、世界基盤モデルNVIDIA Cosmos」や映像解析AI「NVIDIA Metropolis」を統合。これにより、現実では困難なシミュレーションや、高精度なAIモデルの迅速な訓練が可能になります。

なぜ今、都市DXが急務なのでしょうか。国連は2050年までに世界人口の3分の2が都市に集中すると予測しており、インフラや公共サービスへの負荷増大は避けられません。特にスマート交通管理市場は2027年までに200億ドル規模に達する見込みで、AI活用による効率化は都市の持続可能性を左右する重要な鍵となります。

パートナー企業による導入事例も次々と生まれています。例えば、地理情報システムのEsriは、ノースカロライナ州ローリー市で、膨大なカメラデータをAIがリアルタイムで分析し、交通状況を地図上に可視化するシステムを構築。これにより、問題発生時の迅速な対応や、渋滞緩和によるCO2排出量削減を目指します。

台湾のLinker Visionは、このブループリントを全面的に採用し、高雄市でインシデント対応時間を最大80%削減する成果を上げました。この成功を足掛かりに、ベトナムのホーチミン市やダナン市へも展開。交通量や建設状況をシミュレーション・監視し、都市の運営効率を飛躍的に高めようとしています。

他にも、アイルランドのダブリンでは、Bentley SystemsやVivaCityが協力し、自転車や歩行者などの移動データをデジタルツイン上で分析。また、デロイトはAIによる横断歩道の自動点検システムを開発するなど、世界中のエコシステムパートナーNVIDIAの技術基盤の上で革新的なソリューションを生み出しています。

NVIDIAとそのパートナーが示す未来は、データとAIが都市の神経網のように機能し、より安全で効率的な市民生活を実現する世界です。この「フィジカルAI」という新たな潮流は、都市運営のあり方を根本から変革する可能性を秘めており、経営者エンジニアにとって見逃せない動きと言えるでしょう。

独の産業革新へ、NVIDIAとテレコムがAIクラウド創設

データ主権守る巨大AI基盤

10億ユーロ規模の共同事業
ドイツ国内でデータを管理
欧州の産業競争力を強化
2026年初頭に稼働開始

最高峰技術とエコシステム

NVIDIA最新GPUを最大1万基
独テレコムがインフラ提供
SAP、シーメンス等が参画

半導体大手NVIDIAドイツテレコムは11月4日、ドイツ国内に世界初となる産業特化のAIクラウド「Industrial AI Cloud」を共同で設立すると発表しました。総額10億ユーロを投じ、2026年初頭の稼働を目指します。この提携は、ドイツのデータ主権を守りながら産業のデジタルトランスフォーメーションを加速させ、欧州の国際競争力を高めることを目的としています。

NVIDIAのジェンスン・フアンCEOは、AIを稼働させるデータセンターを「現代版の工場」と表現し、知能を生み出す重要性を強調しました。このプロジェクトは、欧州企業が自国のデータ管理下で安全にAI開発を進める「ソブリンAI(データ主権AI)」の実現に向けた大きな一歩となります。

ミュンヘン近郊に新設される「AIファクトリー」には、NVIDIAの最新GPU「Blackwell」アーキテクチャを採用したシステムなどが最大10,000基搭載される計画です。ドイツテレコムは信頼性の高いインフラと運用を提供し、企業が大規模なAIモデルのトレーニングや推論を高速かつ柔軟に行える環境を整えます。

この構想には、ソフトウェア大手SAPや製造業大手シーメンスなど、ドイツを代表する企業がエコシステムパートナーとして参画します。メルセデス・ベンツやBMWといった自動車メーカーも、AI駆動のデジタルツインを用いた複雑なシミュレーションでの活用を見込んでおり、幅広い産業での応用が期待されます。

具体的な活用例としては、製品開発を高速化するデジタルツイン、工場の自動化を進めるロボティクス、設備の故障を事前に予測する予知保全などが挙げられます。製造業の変革を促す「インダストリー4.0」をさらに加速させる起爆剤となるでしょうか。

今回の提携は、ドイツの国際競争力強化を目指す官民イニシアチブ「Made for Germany」から生まれた最初の具体的な成果の一つです。欧州では、外国の巨大テック企業への技術依存を減らしデジタル主権を確立する動きが強まっており、このAIクラウド欧州独自の技術革新の新たな核となる可能性を秘めています。

NVIDIA、物理AI開発を加速する新基盤モデル

物理AI開発の課題

現実世界のデータ収集コスト
開発期間の長期化
多様なシナリオの網羅性不足

新Cosmosモデルの特長

テキスト等から動画世界を生成
気象や照明など環境を自在に変更
従来比3.5倍小型化し高速化

期待されるビジネス効果

開発サイクルの大幅な短縮
AIモデルの精度と安全性の向上

NVIDIAは2025年10月29日、物理AI開発を加速させるワールド基盤モデルNVIDIA Cosmos」のアップデートを発表しました。ロボットや自動運転車の訓練に必要な多様なシナリオのデータを、高速かつ大規模に合成生成する新モデルを公開。これにより、開発者は現実世界でのデータ収集に伴うコストや危険性を回避し、シミュレーションの精度を飛躍的に高めることが可能になります。

ロボットなどの物理AIは、現実世界の多様で予測不能な状況に対応する必要があります。しかし、そのための訓練データを実世界で収集するのは、莫大な時間とコスト、そして危険を伴います。特に、まれにしか起こらない危険なシナリオを網羅することは極めて困難です。この「データ収集の壁」を打ち破る鍵として、物理法則に基づいた合成データ生成が注目されています。

今回のアップデートでは、2つの主要モデルが刷新されました。「Cosmos Predict 2.5」は、テキストや画像動画から一貫性のある仮想世界を動画として生成します。一方「Cosmos Transfer 2.5」は、既存のシミュレーション環境に天候や照明、地形といった新たな条件を自在に追加し、データの多様性を飛躍的に高めます。モデルサイズも従来比3.5倍小型化され、処理速度が向上しました。

これらの新モデルは、NVIDIAの3D開発プラットフォーム「Omniverse」やロボットシミュレーション「Isaac Sim」とシームレスに連携します。開発者は、スマートフォンで撮影した現実空間からデジタルツインを生成し、そこに物理的に正確な3Dモデルを配置。その後、Cosmosを用いて無限に近いバリエーションの訓練データを生成する、という効率的なパイプラインを構築できます。

すでに多くの企業がこの技術の活用を進めています。汎用ロボット開発のSkild AI社は、ロボットの訓練期間を大幅に短縮。また、配送ロボットを手がけるServe Robotics社は、Isaac Simで生成した合成データを活用し、10万件以上の無人配送を成功させています。シミュレーションと現実のギャップを埋めることで、開発と実用化のサイクルが加速しています。

NVIDIAの今回の発表は、物理AI開発が新たな段階に入ったことを示唆します。合成データ生成の質と量が飛躍的に向上することで、これまで困難だった複雑なタスクをこなすロボットや、より安全な自動運転システムの開発が現実味を帯びてきました。経営者やリーダーは、この技術革新が自社の競争優位性にどう繋がるか、見極める必要があります。

NVIDIA、AI工場設計図と新半導体を一挙公開

AI工場構築の設計図

政府向けAI工場設計図を公開
ギガワット級施設のデジタルツイン設計
次世代DPU BlueField-4発表
産業用AIプロセッサ IGX Thor

オープンなAI開発

高効率な推論モデルNemotron公開
物理AI基盤モデルCosmosを提供
6G研究用ソフトをオープンソース化

NVIDIAは10月28日、ワシントンD.C.で開催の技術会議GTCで、政府・規制産業向けの「AIファクトリー」参照設計や次世代半導体、オープンソースのAIモデル群を一挙に発表しました。これは、セキュリティが重視される公共分野から創薬エネルギー、通信といった基幹産業まで、AIの社会実装をあらゆる領域で加速させるのが狙いです。ハード、ソフト、設計思想まで網羅した包括的な戦略は、企業のAI導入を新たな段階へと導く可能性があります。

発表の核となるのが、AI導入の設計図です。政府・規制産業向けに高いセキュリティ基準を満たす「AI Factory for Government」を発表。PalantirやLockheed Martinなどと連携します。また、Omniverse DSXブループリントは、ギガワット級データセンターデジタルツインで設計・運用する手法を提示。物理的な建設前に効率や熱問題を最適化し、迅速なAIインフラ構築を可能にします。

AIインフラの性能を根幹から支える新半導体も発表されました。次世代DPU「BlueField-4」は、AIデータ処理、ネットワーキング、セキュリティを加速し、大規模AI工場の中枢を担います。さらに、産業・医療のエッジ向けには、リアルタイム物理AIプロセッサ「IGX Thor」を投入。従来比最大8倍のAI性能で、工場の自動化や手術支援ロボットの進化を後押しします。

開発者エコシステムの拡大に向け、AIモデルのオープンソース化も加速します。高効率な推論でAIエージェント構築を容易にする「Nemotron」モデル群や、物理世界のシミュレーションを可能にする「Cosmos」基盤モデルを公開。さらに、次世代通信規格6Gの研究開発を促進するため、無線通信ソフトウェア「Aerial」もオープンソースとして提供します。

これらの技術は既に具体的な産業応用へと結実しています。製薬大手イーライリリーは、1000基以上のNVIDIA Blackwell GPUを搭載した世界最大級の創薬AIファクトリーを導入。General Atomicsは、核融合炉のデジタルツインを構築し、シミュレーション時間を数週間から数秒に短縮するなど、最先端科学の現場で成果を上げています。

今回の一連の発表は、AIが研究開発段階から、社会を動かす基幹インフラへと移行する転換点を示唆しています。NVIDIAが提示する「AIファクトリー」という概念は、あらゆる産業の生産性と競争力を再定義する可能性を秘めています。自社のビジネスにどう取り入れ、新たな価値を創造するのか。経営者やリーダーには、その構想力が問われています。

NVIDIA、ロボット開発基盤ROSをGPUで加速

AIロボット開発を加速

ROS 2GPU認識機能を追加
性能ボトルネック特定ツールを公開
Isaac ROS 4.0を新基盤に提供
Physical AIの標準化を支援

エコシステムの拡大

高度なシミュレーション環境を提供
産業用ロボットのAI自動化を推進
自律移動ロボット高度なナビゲーション
多くのパートナーがNVIDIA技術を採用

NVIDIAは2025年10月27日、シンガポールで開催のロボット開発者会議「ROSCon 2025」で、ロボット開発の標準的オープンフレームワーク「ROS」を強化する複数の貢献を発表しました。GPUによる高速化や開発ツールの提供を通じ、次世代のPhysical AIロボット開発を加速させるのが狙いです。

今回の取り組みの核心は、ROS 2を実世界のアプリケーションに対応する高性能な標準フレームワークへと進化させる点にあります。NVIDIAはOpen Source Robotics Alliance (OSRA)の「Physical AI」分科会を支援し、リアルタイム制御やAI処理の高速化、自律動作のためのツール改善を推進します。

具体的には、ROS 2にGPUを直接認識・管理する機能を提供。これにより、開発者はCPUやGPUの能力を最大限に引き出し、高速な性能を実現できます。ハードウェアの急速な進化にROSエコシステム全体が対応可能となり、将来性も確保します。

開発効率化のため、性能ボトルネックを特定する「Greenwave Monitor」をオープンソース化。さらにAIモデル群「Isaac ROS 4.0」を最新プラットフォーム「Jetson Thor」に提供。ロボットの高度なAI機能を容易に実装できます。

これらの貢献は既に多くのパートナー企業に活用されています。AgileX Roboticsは自律移動ロボットに、Intrinsicは産業用ロボットの高度な把持機能に技術を採用。シミュレーションツール「Isaac Sim」も広く利用されています。

NVIDIAハードウェアからソフトウェア、シミュレーションまで一貫したプラットフォームを提供し、オープンソースコミュニティへの貢献を続けます。今回の発表は、同社が「Physical AI」の未来を築く基盤整備を主導する強い意志を示すものです。

UCサンタクルーズ、NVIDIA GPUで洪水予測9倍高速化

GPUによる計算高速化

カリフォルニア大学の洪水予測
CPUで6時間かかっていた計算
NVIDIA GPU40分に短縮
シミュレーション速度が9倍に向上

可視化が導く新たな価値

高解像度の洪水リスク可視化
自然の防災効果をデータで証明
政府や企業の意思決定を支援
サンゴ礁保険など新金融商品へ

カリフォルニア大学サンタクルーズ校の研究チームが、NVIDIAGPU技術を活用し、沿岸の洪水予測シミュレーションを大幅に高速化しています。気候変動で高まる洪水リスクを詳細に可視化し、サンゴ礁などの自然が持つ防災効果を定量的に示すことで、政府や金融機関の効果的な対策立案を支援することが目的です。

研究チームは、従来CPUで約6時間かかっていた計算を、NVIDIARTX 6000 Ada世代GPUを1基使うことで、わずか40分に短縮しました。これは9倍の高速化に相当し、プロジェクトの生産性を劇的に向上させています。複数のGPUをクラスタ化すれば、同時に4つのシミュレーションを実行することも可能です。

高速化の鍵は、NVIDIAの並列コンピューティングプラットフォームCUDA-Xです。これにより、膨大な計算を要する流体力学モデルを効率的に処理できます。計算時間の短縮は、パラメータの調整や感度分析といった試行錯誤を容易にし、モデルの精度向上にも大きく貢献しています。

シミュレーション結果は、Unreal Engine 5などのゲームエンジンで説得力のある映像に変換されます。洪水がどのように発生し、自然の防波堤がどう機能するかを視覚的に示すことは、関係者の理解を深め、対策への投資を促す重要なツールとなります。「可視化は行動を動機づける基本だ」と研究者は語ります。

この技術はすでに具体的なビジネスにも繋がっています。メキシコでは、サンゴ礁の防災価値を評価し、ハリケーン被害からの修復費用を賄う世界初の「サンゴ礁保険」が組成されました。可視化データが、沿岸のホテル経営者や政府、世界銀行グループの投資判断を後押しした好例です。

計算能力の向上により、チームはより野心的な目標を掲げています。現在は、気候変動の影響を特に受けやすい全世界の小島嶼開発途上国の洪水マップを作成するプロジェクトに取り組んでおり、その成果は次回の気候変動会議(COP30)で発表される予定です。

NVIDIAとGoogle Cloud提携、企業AI・DXを推進

最新GPU搭載VMの提供

G4 VMでRTX PRO 6000 Blackwell提供
AI推論とビジュアル処理を両立
最大8基のGPU搭載が可能
多様なワークロードを高速化

産業デジタル化を加速

OmniverseとIsaac Simが利用可能に
物理的に正確なデジタルツイン構築
仮想空間でのAIロボット開発
製造業や物流分野のDXを支援

NVIDIAGoogle Cloudは10月20日、企業向けAIと産業のデジタル化を加速する提携拡大を発表しました。Google Cloud上で最新GPU「RTX PRO 6000 Blackwell」を搭載したG4仮想マシン(VM)と、デジタルツイン構築基盤「Omniverse」が利用可能になります。

G4 VMの核となるのは、最新GPU「RTX PRO 6000 Blackwell」です。AI推論と高精細なビジュアル処理の両方で卓越した性能を発揮し、生成AIから複雑なシミュレーションまで、多様なワークロードを単一基盤で高速化します。

特に注目されるのが産業用メタバース基盤「NVIDIA Omniverse」です。物理的に正確な工場のデジタルツイン構築や、仮想空間でのAIロボット開発・検証が可能になり、製造業などの物理AI活用が大きく前進します。

広告大手WPPはフォトリアルな3D広告環境の即時生成に、Altairは複雑なシミュレーションの高速化に本プラットフォームを活用しており、具体的なビジネス成果に繋がり始めています。あらゆる業界で応用が期待できるでしょう。

この統合プラットフォームは、AIモデル「Nemotron」や推論用マイクロサービス「NIM」などNVIDIAの豊富なソフトウェア群も利用可能です。AIエージェント構築から科学技術計算まで、高負荷タスクをクラウド上で実行できます。

今回の提携は、データ分析から物理AIの実装まで一気通貫の開発環境クラウドで提供するものです。企業のデジタルトランスフォーメーションとイノベーションを次の段階へ引き上げる、強力な一手となるでしょう。

OpenAI元研究者ら、AI科学自動化へ3億ドル調達

AI科学自動化の新星

OpenAIGoogle出身者が創業
科学的発見の自動化が目標
スタートアップ名はPeriodic Labs

成功を支える3つの技術

LLMの高度な推論能力
信頼性の高いロボットアーム
高精度な物理シミュレーション

巨額資金と超電導開発

シードで3億ドルという巨額調達
当面の目標は新超電導物質の発見

OpenAIの著名研究者リアム・フェドゥス氏と元Google Brainのエキン・ドウス・キュバック氏が、新スタートアップ「Periodic Labs」を設立し、ステルスモードを解除しました。同社はAIによる科学的発見の自動化を目指しており、シードラウンドで3億ドル(約450億円)という異例の巨額資金調達に成功し、シリコンバレーで大きな注目を集めています。

創業者の二人は、生成AIが科学的発見を根本から変えるという議論が深まる中、ついにその構想を現実にする時が来たと判断しました。シミュレーションによる新化合物の発見、ロボットによる物質合成、そしてLLMによる結果分析と軌道修正という一連のプロセスを完全に自動化する、壮大なビジョンを掲げています。

この挑戦を可能にしたのは、近年の3つの技術的進展です。一つは、フェドゥス氏自身も開発に関わったLLMの強力な推論能力。二つ目は、粉末合成をこなせるロボットアームの信頼性向上。そして三つ目が、複雑な物理システムをモデル化できる機械学習シミュレーションの高精度化です。

Periodic Labsのアプローチが画期的なのは、実験の「失敗」にも価値を見出している点です。従来の科学では成功が評価されますが、AIにとっては失敗データも現実世界との接点を持つ貴重な学習データとなります。これにより、AIモデルをさらに強化できると創業者らは考えています。

フェドゥス氏の退職ツイートは、ベンチャーキャピタルVC)による激しい争奪戦の引き金となりました。ある投資家は「ラブレター」を送ったほどです。最終的に、元OpenAIの同僚が在籍するFelicisがリード投資家に決定。他にもNVIDIAやジェフ・ベゾス氏など、著名な投資家が名を連ねています。

巨額の資金を元手に、同社はすでに各分野の専門家を集め、ラボを設立済みです。当面の目標は、よりエネルギー効率の高い技術の鍵となる新しい超電導物質の発見です。AIによる科学はまだ黎明期ですが、このチームの挑戦は、その可能性を大きく切り開くかもしれません。

MIT発、服を自在に組み替えるサステナブル設計術

服をモジュール化する新発想

デザイン構成要素に分解
描画ツールで直感的に設計
3Dモデルで着用時をシミュレーション

サステナブルな未来の服

ズボンをドレスに自在に組み替え
体型変化やトレンドに対応
年間9200万トンの繊維廃棄削減に貢献

誰でも使えるデザインツール

初心者でも30分で試作品
スナップやベルクロで簡単に接合

マサチューセッツ工科大学(MIT)とアドビの研究チームが、衣服を自在に組み替えられる革新的なデザインソフトウェア「Refashion」を発表しました。このツールは、デザインを小さなモジュールに分解し、ズボンをドレスに変えるといった再構成を可能にします。ファッション業界が抱える年間9200万トンもの繊維廃棄物問題に、テクノロジーで挑む画期的な試みです。

「Refashion」の最大の特徴は、デザインのモジュール化です。ユーザーは専用の描画ツールでパーツを描き、それらをパズルのように組み合わせるだけで設計図が完成します。テンプレートも用意されており、Tシャツやパンツなどの基本的なアイテムを元に、直感的なカスタマイズが可能です。

このシステムでは、プリーツやダーツといった専門的なデザイン技法も簡単に取り入れられます。これにより、体にフィットするシャツや、ふんわりとしたスカートなど、デザインの幅が大きく広がります。単なる機能性だけでなく、創造性を刺激するツールとしての側面も持ち合わせています。

パーツの接合には、縫製だけでなく金属スナップやベルクロといった再利用可能な方法を推奨しています。これにより、誰でも簡単にパーツの付け外しや交換ができます。ダメージを受けた部分だけを修理したり、気分に合わせてスタイルを変えたりすることが、手軽に行えるようになります。

デザインした衣服は、2Dのマネキン上でレイアウトを確認後、様々な体型の3Dモデルで着用シミュレーションが可能です。これにより、実際に制作する前にフィット感や見た目を正確に把握できます。初心者でもわずか30分で試作品を完成させられる手軽さも実証されています。

この取り組みは、服のライフサイクルを根本から変える可能性を秘めています。トレンドの移り変わりや体型の変化に合わせて服を買い替えるのではなく、手持ちの服を再構成する文化を創造します。サステナビリティが経営の重要課題となる中、廃棄を前提としない新しいものづくりの形を示しています。

チームは今後、より丈夫な生地への対応や曲線パネルなどの新機能追加、さらには古着を「リミックス」する機能も検討しています。コンピューター支援設計が持続可能なファッション業界の実現を後押しする、先進的な事例として注目されます。

ゲーム動画でAI訓練、時空間推論へ200億円調達

巨額調達の背景

シードで約200億円という巨額調達
ゲーム動画共有Medal社からスピンアウト
年間20億本動画を学習データに活用
OpenAI買収を試みた優良データ

AIの新たな能力

LLMが苦手な物理世界の直感を学習
未知の環境でも行動を的確に予測

想定される応用分野

ゲーム内の高度なNPC開発
捜索救助ドローンロボットへの応用

ゲーム動画共有プラットフォームのMedal社からスピンアウトしたAI研究所「General Intuition」が、シードラウンドで1億3370万ドル(約200億円)という異例の資金調達を発表しました。同社は、Medalが持つ年間20億本ものゲーム動画を学習データとし、AIに現実世界での動きを直感的に理解させる「時空間推論」能力を訓練します。これは現在の言語モデルにはない能力で、汎用人工知能(AGI)開発の新たなアプローチとして注目されています。

同社が活用するゲーム動画データは、その質の高さからOpenAIも過去に買収を試みたと報じられるほどです。CEOのピム・デ・ウィッテ氏によれば、ゲーマーが投稿する動画は成功や失敗といった極端な事例(エッジケース)が多く、AIの訓練に非常に有用なデータセットとなっています。この「データ・モート(データの堀)」が、巨額の資金調達を可能にした大きな要因です。

「時空間推論」とは、物体が時間と空間の中でどのように動き、相互作用するかを理解する能力を指します。文章から世界の法則を学ぶ大規模言語モデル(LLM)に対し、General Intuitionは視覚情報から直感的に物理法則を学ばせるアプローチを取ります。同社は、この能力こそが真のAGIに不可欠な要素だと考えています。

開発中のAIエージェントは、訓練に使われていない未知のゲーム環境でも、人間のプレイヤーが見るのと同じ視覚情報のみで状況を理解し、次にとるべき行動を正確に予測できる段階にあります。この技術は、ゲームのコントローラーで操作されるロボットアームやドローン、自動運転車といった物理システムへ自然に応用できる可能性があります。

初期の実用化分野として、2つの領域が想定されています。一つは、ゲーム内でプレイヤーの習熟度に合わせて難易度を動的に調整し、常に最適な挑戦を提供する高度なNPC(ノンプレイヤーキャラクター)の開発です。もう一つは、GPSが使えない未知の環境でも自律的に飛行し、情報を収集できる捜索救助ドローンの実現です。

競合他社がシミュレーション環境(ワールドモデル)そのものを製品化するのに対し、General Intuitionはエージェントの応用事例に注力する戦略をとります。これにより、ゲーム開発者コンテンツと競合したり、著作権問題を引き起こしたりするリスクを回避する狙いもあります。

今回の資金調達はKhosla VenturesとGeneral Catalystが主導しました。シードラウンドとしては異例の規模であり、ゲームから生まれたデータが次世代AI開発の鍵を握るという期待の大きさを物語っています。同社の挑戦は、AI技術の新たな地平を切り開くかもしれません。

AIが細胞変化を画像で予測、創薬の実験を代替

AI創薬の新モデル登場

新AIモデルMorphDiff
遺伝子情報から細胞画像を生成
実験前に薬の効果を可視化

コストと時間を大幅削減

高価な画像化実験を代替
作用機序の特定を高速化
画像に迫る予測精度を達成

ビジネスへの応用

新薬候補の優先順位付け
既存薬の再利用(リパーパシング)

アラブ首長国連邦のAI専門大学院大学MBZUAIの研究者らが、創薬プロセスを革新する可能性を秘めた新しいAIモデル「MorphDiff」を開発しました。このモデルは、薬物投与などによって変化する遺伝子の活動パターンをもとに、細胞がどのように変化するかを画像で高精度に予測します。これにより、時間とコストのかかる実験の一部をコンピュータ上のシミュレーションで代替することを目指します。

MorphDiffの核心は、画像生成AIで広く使われる「拡散モデル」技術の応用です。薬などの刺激によってどの遺伝子が活性化・不活性化したかという情報(トランスクリプトーム)を入力するだけで、摂動後の細胞のリアルな顕微鏡画像を生成できます。これにより、実験室で実際に細胞を培養し観察する前に、その結果をプレビューすることが可能になります。

この技術がもたらす最大の利点は、創薬研究における試行錯誤を大幅に削減できる点です。従来、何百万もの候補化合物の効果を一つ一つ画像化して評価するのは不可能でした。しかしMorphDiffを使えば、コンピュータ上で多数の化合物の効果をシミュレートし、有望な候補を効率的に絞り込めます。

生成される画像は単なる想像図ではありません。細胞の質感や内部構造といった数百もの生物学的特徴を正確に捉えており、その統計的分布は実際の実験データと区別がつかないレベルに達しています。この高い忠実性により、薬がどのように作用するかのメカニズム(MOA)を正確に推定するのに役立ちます。

具体的な応用例として、新薬候補のスクリーニングが挙げられます。未知の化合物が生み出す細胞変化の画像を予測し、既知の薬の作用パターンと比較することで、その化合物の潜在的な効果や副作用を迅速に評価できます。これは開発パイプライン全体の効率化に直結するでしょう。

現状では推論速度などの課題も残されていますが、今後の研究開発により、コンピュータ内での実験が現実の実験を強力に補完する未来が近づいています。この技術は、創薬研究のあり方を変え、より早く、より安価に新薬を届けるための重要な一歩となる可能性があります。

AI消費者のデジタルツイン、市場調査を革新

新技術「SSR」の仕組み

LLMによる消費者行動シミュレーション
従来の調査では不可能なスケール
テキスト意見を数値評価に変換
意味的類似性評価を利用

高精度と現代的課題解決

人間の9割の信頼性を達成
AIによる調査汚染問題を解決
データの均質化を防ぐ制御環境
定性理由も同時に生成可能

ビジネスへの大きな影響力

製品開発サイクルを大幅に短縮
コストを大幅に削減可能
デジタル・フォーカスグループ実現

新しいAI技術が、消費者の「デジタルツイン」を生成し、市場調査業界に変革をもたらします。国際研究チームが開発した「意味的類似性評価(SSR)」は、人間に近い評価を高速で生成可能です。

従来、LLMに製品評価を数値で求めても、不自然で偏った回答が課題でした。これがAIによる市場調査普及の障壁となっていたのです。

SSRは、LLMに数値ではなく文章で意見を求めます。その文章をベクトル化し、評価ごとの定型文との意味的類似性を測定してスコアを決定する仕組みです。

ある大手企業の9300件以上の実データでテストした結果、SSRは人間の評価信頼性の90%を達成。AIによる評価分布は、人間のものと統計的にほぼ一致しました。

この開発は、AIが回答する人間の調査員によって伝統的な調査の信頼性が損なわれる現代において、極めて重要です。SSRは汚染データを防ぐ「制御された環境」を提供します。

企業はターゲット層のデジタル・フォーカスグループを数時間で生成可能に。製品コンセプトの検証サイクルを飛躍的に加速し、コストも大幅に削減できるでしょう。

今回の検証はパーソナルケア製品に限定されていますが、その可能性は計り知れません。AI消費者シミュレーションの時代は、すでに始まっていると言えるでしょう。

AIでロボット訓練環境を革新:物理法則守る多様な仮想世界を超速生成

訓練環境の課題克服

実機訓練の時間とコストを大幅削減
従来のシミュレーション物理的な不正確さを解消

コア技術とリアリティ担保

生成AI(拡散モデル)を活用した3D仮想環境の創出
MCTS適用により複雑で多様な配置を自動設計
フォークが皿を貫通しないなど物理的正確性を保証

高精度なシーン生成

テキスト指示で目的通りのシーンを高精度に生成
将来は開閉可能な物体や新規オブジェクトにも対応

マサチューセッツ工科大学(MIT)とトヨタ研究所は、ロボットの訓練を革新する新しい生成AI技術「Steerable Scene Generation(ステアラブル・シーン生成)」を開発しました。このシステムは、キッチンやレストランなど、多様な実世界の仮想環境を、物理法則にのっとりながら、手作業の数倍の効率で自動生成します。これにより、時間とコストがかかる実機訓練や、不正確さが課題だった従来のシミュレーションの壁を破り、ロボット開発の生産性を飛躍的に高めることが期待されています。

ロボットが現実世界で有用なアシスタントとなるためには、膨大で多様なデモンストレーションデータが必要です。しかし、実際のロボットでデータ収集するのは非効率的です。従来のシミュレーション環境作成は、手作業でデジタル環境を設計するか、非現実的な物理現象(オブジェクトの貫通など)を含むAI生成に頼るしかありませんでした。「ステアラブル・シーン生成」は、この訓練データの多様性とリアリティの欠如という長年のボトルネックを解消することを目指しています。

本技術の中核は、生成AIの拡散モデルを「ステアリング」(誘導)することです。特に注目すべきは、ゲームAIとして有名な「モンテカルロ木探索(MCTS)」を3Dシーン生成タスクに初めて適用した点です。MCTSは、シーン生成を連続的な意思決定プロセスと捉え、部分的なシーンを段階的に改良します。これにより、モデルが学習したデータセットに含まれるよりもはるかに複雑で、多様性の高いシーンを自動で作り出します。

仮想環境のリアルさは、ロボットが実世界で動作するために不可欠です。このシステムは、物理的な正確性を徹底的に保証します。例えば、テーブル上のフォークが皿を突き抜ける「クリッピング」といった3Dグラフィックス特有の不具合を防ぎます。訓練では、4400万件以上の3Dルームデータを利用しており、これが実世界に近いインタラクションをシミュレートする基盤となっています。

本システムは、強化学習を用いた試行錯誤や、ユーザーが直接テキストプロンプトを入力することで、柔軟に利用できます。「キッチンにリンゴ4個とボウルを」といった具体的指示に対しても、パントリーの棚配置で98%、散らかった朝食テーブルで86%という高い精度でシーンを構築することに成功しています。これは既存の類似手法に比べ、10%以上の改善であり、ロボット工学者が真に利用可能なデータを提供します。

研究者らは今後、この技術をさらに進化させ、既存のライブラリに頼らず、AIが新しいオブジェクト自体を生み出すことや、キャビネットや瓶といった「開閉可能な関節オブジェクト」を組み込むことを計画しています。このインフラが普及すれば、多様でリアルな訓練データが大量に供給され、器用なロボットの実用化に向けた大きな一歩となるでしょう。ロボット開発の効率化と市場投入の加速に直結する重要な進展です。

MLで5倍強いアルミ合金開発 3Dプリントにより航空機軽量化へ

機械学習が導くレシピ

高性能アルミニウム合金のレシピを特定
機械学習を活用した新材料探索
100万通りから40通りに絞り込み成功

高強度化の鍵となる製法

従来の5倍の強度を実現
3Dプリント(LBPF)を採用
急速冷却による微細な析出物を生成

軽量化とコスト削減効果

ジェットエンジンファンブレードへの応用
チタンより50%軽量かつ低コスト
輸送産業のエネルギー節約に寄与

MITエンジニアチームは、機械学習(ML)を活用し、従来の製法に比べ5倍の強度を持つ3Dプリント可能なアルミニウム合金を開発しました。この新合金は、航空機や高性能自動車部品の軽量化を加速させ、輸送産業における大幅なエネルギー節約に貢献すると期待されています。MLによる効率的な材料設計と積層造形(3Dプリント)技術の組み合わせが、高強度と耐熱性を両立させました。

従来、新しい合金を開発するには、100万通り以上の組成をシミュレーションする必要がありましたが、MLを導入することで、わずか40通りの組成評価で最適な配合を特定できました。複雑な要素が非線形に寄与する材料特性探索において、MLツールは設計空間の探索を劇的に効率化します。この手法は、今後の合金設計プロセス全体を変革する可能性を秘めています。

高強度を実現した鍵は、製造プロセスにあります。従来の鋳造では冷却に時間がかかり、合金の強度を左右する微細な析出物が大きく成長してしまいます。対照的に、チームが採用したレーザー粉末床溶融結合(LBPF)などの3Dプリント技術は、急速な冷却と凝固を可能にし、予測通りの高強度を持つ微細な析出物を安定的に生成しました。

新合金は、現行の最強の鋳造アルミニウム合金に匹敵する強度を持ち、さらにアルミニウム合金としては非常に高い400度Cまでの高温安定性を誇ります。これにより、ジェットエンジンのファンブレードなど、これまでチタンや複合材が使われていた部品への適用が可能になります。チタンより50%以上軽量かつ最大10分の1のコストで済むため、部品製造の収益性を高めます。

この3Dプリント可能な新合金は、複雑な形状の製造に適しており、航空機部品のほかにも、高性能自動車データセンターの冷却装置など、幅広い分野での利用が見込まれています。材料設計と積層造形の特性を組み合わせたこの新たな設計手法は、様々な産業における軽量化ニーズに対応し、革新的な製品開発の扉を開きます。

核融合炉の信頼性向上へ MITがMLと物理モデルを融合しプラズマ挙動を予測

核融合発電の課題

超高温プラズマを磁場で封じ込め
プラズマ電流停止時(ランプダウン)に不安定化
不安定化は炉内壁を損傷させ、修理コストが増大

MLと物理モデルの融合

MLと物理ベースモデルを組み合わせ予測
少ないデータ量で高精度な予測を実現
スイスの実験炉データで有効性を確認済み

実用化への貢献

制御指令(トラジェクトリ)を自動生成し、安全な停止を指示
商用化を目指すCFS社と連携し実機適用を推進

マサチューセッツ工科大学(MIT)の研究チームは、核融合炉の安定稼働に不可欠なプラズマ挙動の予測モデルを開発しました。機械学習(ML)と物理ベースのシミュレーションを組み合わせることで、運転終了時の「ランプダウン」におけるプラズマの不安定化を正確に予測します。この技術は、炉の損傷を防ぎ、将来的な核融合発電プラントの信頼性と安全性を飛躍的に向上させると期待されています。

核融合炉の心臓部であるトカマク型装置は、太陽の核よりも高温のプラズマを強力な磁場で封じ込めます。プラズマ電流が不安定になると、炉内壁を損傷するリスクがあり、特に高速で循環する電流を停止させるランプダウン時に問題が発生しやすいです。損傷が発生すると、修理に時間と多大な資源が必要となります。

MITが開発したのは、ニューラルネットワークと既存のプラズマダイナミクス物理モデルを組み合わせたハイブリッド手法です。超高温・高エネルギーのプラズマはデータ収集が難しく高コストですが、この複合モデルを採用することで、非常に少ない実験データで高い精度を実現しました。これにより、トレーニング効率が大幅に改善されます。

この予測モデルに基づき、プラズマを安定的に停止させるための具体的な制御指令(トラジェクトリ)を自動生成するアルゴリズムも開発されました。スイスの実験用トカマク(TCV)での検証では、従来手法に比べて迅速かつ安全にランプダウンを完了できることが統計的に証明されています。実用化に向けた大きな一歩です。

この技術は、MITのスピンアウト企業であり、世界初の商用規模の核融合炉開発を目指すコモンウェルス・フュージョン・システムズ(CFS)社と共同で進められています。CFSが開発中の実証炉「SPARC」に本モデルを適用し、エネルギーなプラズマの安定制御を実現することで、安全かつ信頼性の高い核融合発電の実現を加速させます。

NVIDIA、クラウドゲーム強化 10月に新作17本投入

10月の新作ラインナップ

期待の新作『Battlefield 6』が登場
『リトルナイトメア3』など話題作多数
合計17本のゲームクラウドで提供
ホラーからシミュレーションまで多彩なジャンル

サービスとインフラ強化

RTX 5080級サーバーを順次拡大
マイアミとワルシャワでアップグレード完了
『inZOI』などRTX 5080対応タイトルも
高品質なゲーム体験の追求

NVIDIAは2025年10月2日、同社のクラウドゲーミングサービス「GeForce NOW」に10月中に17本の新作ゲームを追加すると発表しました。期待のシューター『Battlefield 6』を含む大型タイトルが揃い、サービスを拡充します。同時に、最新GPUを搭載したサーバーインフラの強化も進めており、ユーザー体験の向上を図ります。

10月のラインナップの目玉は、世界的に人気のシューティングゲーム最新作『Battlefield 6』です。このほかにも、ホラーアドベンチャーの『リトルナイトメア3』や『Vampire: The Masquerade – Bloodlines 2』など、多様なジャンルの話題作が月を通じて順次提供される予定です。

ゲーム体験の質を高めるため、インフラ投資も加速させています。最新のGeForce RTX 5080クラスの性能を持つサーバーへのアップグレードを世界各地で進めており、新たにマイアミとワルシャワでの導入が完了。今後はポートランドやアッシュバーンなどにも展開されます。

RTX 5080の強力なグラフィックス性能を最大限に活かすタイトルも増えています。リアルな描写で話題の『inZOI』や、大規模戦闘が特徴の『Total War: Warhammer III』などが既に対応しており、ユーザーは最高品質の設定でこれらのゲームを楽しむことが可能です。

また、今週すぐプレイ可能になるタイトルとして、『Train Sim World 6』や『Alien: Rogue Incursion Evolved Edition』など6本が追加されました。NVIDIAは継続的なコンテンツ拡充とインフラ投資の両輪で、クラウドゲーミング市場での競争力を高めています。

MIT、米国大学最強のAIスパコンを公開

圧倒的な計算能力

米国大学で最強のAIスパコン
ピーク性能は2 AIエクサフロップス
600基以上のNVIDIAGPU搭載

生成AI研究を加速

生成AIの開発・応用に特化
創薬や新素材設計への応用
気象データ補完や異常検知

幅広い分野への貢献

航空管制や国防分野での実績
ユーザーフレンドリーな設計
エネルギー効率の高い運用も追求

マサチューセッツ工科大学(MIT)リンカーン研究所は2025年10月2日、米国の大学で最も強力なAIスーパーコンピュータ「TX-GAIN」を公開したと発表しました。このシステムは、生成AIや物理シミュレーション、データ分析といった最先端分野の研究を加速させ、科学技術におけるブレークスルー創出を目的としています。研究者はこの圧倒的な計算能力を活用し、新たなイノベーションを追求します。

TX-GAINの性能は、ピーク時で2 AIエクサフロップス(毎秒200京回のAI向け演算)に達します。AI処理に特化した600基以上のNVIDIAGPUがこの計算能力を支え、米国の大学でトップ、北東部地域全体でも最強のAIシステムと評価されています。今夏オンライン化されて以来、研究者の注目を集めています。

TX-GAINの名称が示す通り、特に生成AIの開発と応用に力が注がれています。大規模言語モデルだけでなく、レーダー署名の評価、気象データの補完、ネットワークの異常検知、さらには新薬や新素材の設計といった多様な領域で活用が進みます。これまで不可能だった規模のシミュレーションやモデル訓練が可能になります。

リンカーン研究所スーパーコンピューティングセンター(LLSC)は、これまでも国の重要課題解決に貢献してきました。連邦航空局向けの航空機衝突回避システムや、国防総省向けの自律航法モデルの訓練など、社会の安全保障に直結する研究で数々の実績を上げています。TX-GAINはこれらの取り組みをさらに加速させる強力な基盤となります。

LLSCは、専門家でなくてもスパコンを利用できる「インタラクティブ性」を重視し、ラップトップPCのような手軽な操作性を実現。同時に、AIの膨大な電力消費という課題にも向き合い、エネルギー効率の高い運用と省電力化技術の研究にも取り組むなど、持続可能な研究環境の構築を目指しています。

Google新画像AI、編集・生成の常識を覆す

驚異の編集・生成能力

文脈を理解し一貫性を維持
本人そっくりの人物画像を生成
自然言語によるピクセル単位の修正
AIが曖昧な指示も的確に解釈

新たな創造性の探求

スケッチからリアルな画像を生成
古い写真の修復・カラー化も可能
最大3枚の画像を融合し新画像を創造
開発者向けツールとのシームレスな連携

Googleは2025年8月下旬、Geminiアプリに搭載された新しい画像生成・編集AIモデル「Nano Banana」を発表しました。このモデルはテキストと画像を同時に処理するネイティブなマルチモーダル能力を持ち、リリースからわずかな期間で50億以上の作品を生み出すなど世界中で注目を集めています。専門的なツールを不要にするその革新的な機能は、ビジネスにおける創造性の常識を大きく変える可能性を秘めています。

Nano Bananaの最大の強みは、シーンやキャラクターの一貫性を維持する能力です。一度生成した人物の服装やポーズ、背景だけを変更するなど、連続した編集が可能です。これにより、従来のAIが生成しがちだった「本人とは少し違う」違和感を解消し、広告素材のバリエーション作成や製品プロモーションなど、より実用的な応用が期待されます。

さらに、自然言語による「ピクセル単位の編集」も注目すべき機能です。「ソファの色を赤に変えて」といった簡単な指示で、画像内の特定要素だけを他の部分に影響を与えることなく修正できます。これにより、インテリアデザインシミュレーションや、WebサイトのUIモックアップ修正といったタスクを、専門家でなくとも直感的に行えるようになります。

このモデルは、曖昧な指示から文脈を読み取って画像を生成したり、古い写真を歴史的背景を理解した上で修復・カラー化したりすることも可能です。また、最大3枚の画像を組み合わせて全く新しい画像を創造する機能もあり、アイデアの着想からプロトタイピングまでの時間を大幅に短縮し、これまでにないクリエイティブな表現を可能にします。

エンジニア開発者にとってもNano Bananaは強力なツールとなります。Geminiアプリ内のCanvasやGoogle AI Studioと統合されており、画像ベースのアプリケーションを容易に構築できます。実際に、1枚の写真から様々な時代のスタイルに合わせた画像を生成する「PictureMe」のようなアプリが、社内のプロジェクトから生まれています。

Nano Bananaは、単なる画像生成ツールにとどまりません。専門的なスキルがなくとも誰もがアイデアを形にできる「創造性の民主化」を加速させます。Googleはすでに次の改良に取り組んでおり、この技術が今後、企業のマーケティングや製品開発にどのような革新をもたらすか、引き続き目が離せないでしょう。

OpenAI、音声付き動画AI発表 ディープフェイクアプリも

Sora 2の進化点

映像と同期する音声の生成
対話や効果音もリアルに再現
物理法則のシミュレーション精度向上
複雑な指示への忠実性が大幅アップ

ディープフェイクアプリ

TikTok風のSNSアプリを同時公開
自身の「カメオ」ディープフェイク作成
公開範囲は4段階で設定可能
誤情報や著作権侵害への懸念が噴出

OpenAIが10月1日、動画生成AIの次世代モデル「Sora 2」と、TikTok風のSNSアプリ「Sora」を同時公開しました。Sora 2は映像と同期した音声生成が可能となり、専門家からは「動画生成におけるChatGPTの瞬間」との声も上がっています。しかし、自身の分身(カメオ)を手軽に作成できる機能は、ディープフェイクによる誤情報拡散のリスクをはらんでおり、社会的な議論を呼んでいます。

Sora 2」の最大の進化点は、音声との同期です。これまでのモデルと異なり、人物の対話や背景の環境音、効果音などを映像に合わせて違和感なく生成できます。さらに、物理法則のシミュレーション精度も向上しており、より現実に近い、複雑な動きの再現が可能になりました。

同時に発表されたiOSアプリ「Sora」は、AI生成動画を共有するSNSです。最大の特徴は「カメオ」機能。ユーザーが自身の顔をスキャンして登録すると、テキスト指示だけで本人そっくりの動画を作成できます。友人や一般への公開範囲も設定可能です。

この新技術はエンターテイメントやコミュニケーションの新たな形を提示する一方、深刻なリスクも内包しています。特に、リアルなディープフェイクを誰でも簡単に作れる環境は、悪意ある偽情報の拡散や、いじめ、詐欺などに悪用される危険性が専門家から指摘されています。

著作権の問題も浮上しています。報道によると、Sora著作権者がオプトアウト(拒否)しない限り、そのコンテンツを学習データに利用する方針です。アプリ内では既に人気キャラクターの無断使用も見られます。OpenAIは電子透かし等の対策を講じますが、実効性には疑問の声が上がっています。

Sora 2」とSoraアプリの登場は、動画生成AIが新たなステージに入ったことを示しています。利便性と創造性を飛躍的に高める一方で、倫理的・社会的な課題への対応が急務です。経営者開発者は、この技術の可能性とリスクの両面を深く理解し、慎重に活用戦略を検討する必要があるでしょう。

AI動画は物理法則を理解したか?Google論文の検証

DeepMindの野心的な主張

Google Veo 3の能力を検証
ゼロショットでのタスク解決を主張
汎用的な視覚基盤モデルへの道筋

見えてきた性能の限界

一部タスクでは高い一貫性
ロボットの動作や画像処理で成功
全体としては一貫性に欠ける結果
「世界モデル」構築はまだ途上

Google DeepMindが、最新のAI動画モデル「Veo 3」が物理世界をどの程度理解できるかを探る研究論文を発表しました。論文では、Veo 3が訓練データにないタスクもこなす「世界モデル」への道を歩んでいると主張しますが、その結果は一貫性に欠け、真の物理世界のシミュレーション能力には依然として大きな課題があることを示唆しています。

研究者らは、Veo 3が明示的に学習していない多様なタスクを解決できる「ゼロショット学習者」であると主張します。これは、AIが未知の状況に対しても柔軟に対応できる能力を持つことを意味し、将来的に汎用的な視覚基盤モデルへと進化する可能性を示唆するものです。

確かに、一部のタスクでは目覚ましい成果を上げています。例えば、ロボットの手が瓶を開けたり、ボールを投げたり捕ったりする動作は、試行を通じて安定して説得力のある動画を生成できました。画像のノイズ除去や物体検出といった領域でも、ほぼ完璧に近い結果を示しています。

しかし、その評価には注意が必要です。外部の専門家は、研究者たちが現在のモデルの能力をやや楽観的に評価していると指摘します。多くのタスクにおいて結果は一貫性を欠いており、現在のAI動画モデルが、現実世界の複雑な物理法則を完全に理解していると結論付けるのは時期尚早と言えるでしょう。

経営者エンジニアにとって重要なのは、この技術の現状と限界を冷静に見極めることです。AI動画生成は強力なツールとなり得ますが、物理的な正確性が求められるシミュレーションロボット工学への応用には、まだ慎重な検証が必要です。

AIがバッテリー開発を加速、数千万候補から発見

AIによる探索の高速化

3200万候補から80時間で発見
リチウム使用量70%削減の可能性
AIで候補を絞り専門家が最終判断

多様なAIアプローチ

化学基礎モデルで電解質を最適化
LLMで安定性の高い素材を予測
デジタルツインでバッテリー寿命を模擬

次世代への展望

量子コンピュータとの連携
より複雑な化学反応の高精度予測

Microsoftの研究者らがAIを活用し、バッテリーの主要材料であるリチウムの使用量を劇的に削減できる新素材を発見しました。従来は数年かかっていた探索を、AIは3200万以上もの候補からわずか80時間で有望なものを選び出すことに成功。この成果は、AIが材料科学の研究開発を根本から変革する可能性を示しており、電気自動車(EV)やエネルギー貯蔵システムの未来に大きな影響を与えるでしょう。

Microsoftの手法は、まさにAIの真骨頂と言えます。まず、AIモデルが3200万の候補の中から安定して存在しうる分子構造を50万まで絞り込みます。次に、バッテリーとして機能するために必要な化学的特性を持つものをスクリーニングし、候補をわずか800にまで削減。最終的に専門家がこの中から最も有望な物質を特定しました。このAIとの協業により、発見のプロセスが飛躍的に高速化されたのです。

この動きはMicrosoftだけではありません。IBMもAIを駆使し、既存の化学物質の最適な組み合わせを見つけ出すことで、高性能な電解質の開発に取り組んでいます。数億の分子データを学習した化学基礎モデルを用いて有望な配合を予測。さらに、開発したバッテリーのデジタルツイン(仮想モデル)を作成し、物理的な試作前に充放電サイクルによる劣化をシミュレーションすることで、開発期間の短縮とコスト削減を実現しています。

学術界でもAIの活用は急速に進んでいます。ニュージャージー工科大学の研究チームは、AIを用いてリチウムイオン電池を凌駕する可能性のある5つの新材料候補を発見しました。研究者は「AIに材料科学者になる方法を教えている」と語ります。このように、AIはもはや単なる計算ツールではなく、科学的発見のパートナーとなりつつあるのです。

次なるフロンティアは、量子コンピューティングとの融合です。現在のコンピュータではシミュレーションが困難な複雑な化学反応も、量子コンピュータなら高精度にモデル化できると期待されています。そこから得られる正確なデータをAIの学習に用いることで、さらに革新的な材料の発見が加速するでしょう。AIと量子技術の連携が、持続可能な未来を支える次世代バッテリー開発の鍵を握っています。

NVIDIA、GPUで量子計算の三大課題を解決

量子計算の三大課題を解決

実用化を阻む3つのボトルネック
GPU並列処理で計算量を克服
CUDA-Qなど開発ツール群を提供
大学や企業との連携で研究を加速

驚異的な性能向上事例

AIによるエラー訂正を50倍高速化
回路コンパイルを最大600倍高速化
量子シミュレーションを最大4,000倍高速化

NVIDIAは、同社のアクセラレーテッド・コンピューティング技術が、量子コンピューティングの実用化に向けた最大の課題を解決していると発表しました。GPUの並列処理能力を活用し、量子分野の「エラー訂正」「回路コンパイル」「シミュレーション」という三大課題でブレークスルーを生み出しています。これにより、研究開発が大幅に加速され、産業応用の可能性が現実味を帯びてきました。

最初の課題は「量子エラー訂正」です。量子コンピュータはノイズに弱く、正確な計算のためにはエラーの検出と訂正が不可欠です。NVIDIAは、大学やQuEra社との協業で、AIを活用したデコーダーを開発。CUDA-Qなどのライブラリを用いることで、デコード処理を最大50倍高速化し、精度も向上させることに成功しました。

次に「量子回路コンパイル」の最適化です。これは、抽象的な量子アルゴリズムを物理的な量子チップ上の量子ビットに最適配置する複雑なプロセスです。NVIDIAはQ-CTRL社などと連携し、GPUで高速化する新手法を開発。この最適化プロセスにおいて、従来比で最大600倍の高速化を達成しました。

最後に、より良い量子ビット設計に不可欠な「高忠実度シミュレーション」です。量子システムの複雑な挙動を正確に予測するには膨大な計算が必要となります。NVIDIAcuQuantum SDKをオープンソースツールキットと統合し、大規模なシミュレーションで最大4,000倍の性能向上を実現。AWSなども協力しています。

NVIDIAのプラットフォームは、単に計算を速くするだけでなく、量子研究のエコシステム全体を加速させる基盤技術となっています。経営者エンジニアにとって、これらのツールをいち早く理解し活用することが、未来の市場で競争優位を築く鍵となるでしょう。

NVIDIA、ロボット学習を加速する物理エンジン公開

新物理エンジンNewton

Google、Disneyと共同開発
GPUで高速化されたシミュレーション
複雑な人型ロボットの学習を推進
Linux財団が管理するオープンソース

開発エコシステムの強化

基盤となるOpenUSDフレームワーク
新モデル「Isaac GR00T」も公開
主要ロボット企業が採用を開始
「シム・ファースト」開発の加速

NVIDIAは今週開催のロボット学習カンファレンスで、Google DeepMindやDisney Researchと共同開発した新しい物理エンジン「Newton」をオープンソースとして公開しました。人型ロボットなど複雑な動作が求められる物理AIの開発を、現実世界での実証前にシミュレーションで高速化・安全化させるのが狙いです。

Newtonは、NVIDIAGPU高速化技術「Warp」と3Dデータ標準「OpenUSD」を基盤に構築されています。従来の物理エンジンでは限界があった、人型ロボットの持つ多数の関節やバランス制御といった複雑な動きを、より正確かつ高速にシミュレーション上で学習させることが可能です。

ロボット開発では、実機での試行錯誤にかかる時間やコスト、危険性が課題でした。仮想空間で先に訓練を行う「シム・ファースト」のアプローチは、この課題を解決します。OpenUSDで構築された忠実なデジタルツイン環境が、ロボットのスキル獲得を飛躍的に効率化するのです。

この取り組みはNewton単体にとどまりません。ロボット向け基盤モデル「Isaac GR00T」や開発フレームワーク「Isaac Lab」もアップデートされ、包括的な開発エコシステムが強化されています。既にAgility Roboticsなど主要企業が採用しており、その実用性が示されています。

Linux財団が管理するオープンソースとして公開されたことで、Newtonは今後のロボット開発の新たな標準となる可能性があります。開発の参入障壁を下げ、工場や病院など多様な現場で人間と協働するロボットの実現を大きく前進させるでしょう。

AI開発の主戦場、「ワールドモデル」へ移行加速

LLMの次なるフロンティア

LLMの性能向上に頭打ち感
物理世界を理解する新モデルに注目
動画ロボットデータから学習
GoogleMetaNvidiaが開発を主導

100兆ドル市場への期待と課題

自動運転やロボティクス進化を加速
製造・医療など物理領域への応用
Nvidia幹部が100兆ドル市場と試算
実現には膨大なデータと計算能力が壁

Google DeepMindMetaNvidiaなどの大手AI企業が、大規模言語モデル(LLM)の進歩が鈍化する中、次なる飛躍を求めて「ワールドモデル」の開発に注力し始めています。この新モデルは、言語データではなく動画ロボットデータから物理世界を学習し、人間環境への深い理解を目指します。これは機械による「超知能」実現に向けた新たなアプローチとして注目されています。

OpenAIChatGPTなどに代表されるLLMは、目覚ましい進化を遂げてきました。しかし、各社が投入する最新モデル間の性能差は縮小傾向にあり、開発に投じられる莫大な資金にもかかわらず、進歩に頭打ち感が見え始めています。この状況が、AI開発の新たな方向性を模索する動きを加速させているのです。

ワールドモデルは、LLMとは根本的に異なるアプローチを取ります。テキストデータから言語のパターンを学ぶLLMに対し、ワールドモデル動画シミュレーションロボットの動作データといった物理世界のデータストリームから学習します。これにより、現実世界の法則や因果関係を理解し、将来を予測する能力の獲得を目指します。

この技術が秘める経済的インパクトは計り知れません。Nvidiaの担当副社長であるレヴ・レバレディアン氏は、ワールドモデルが物理世界を理解し操作できるようになれば、その潜在市場は「本質的に100兆ドル」規模、つまり世界経済に匹敵する可能性があると指摘しています。

ワールドモデルは、自動運転車やロボティクス、いわゆる「AIエージェント」の進化に不可欠な一歩と見なされています。製造業やヘルスケアなど、物理的な操作を伴う産業での活用も期待されます。しかし、その実現には膨大なデータと計算能力が必要であり、依然として技術的に未解決の挑戦であることも事実です。

Meta、ロボットOSで覇権狙う AR級の巨額投資

ボトルネックはソフトウェア

ARに次ぐ数十億ドル規模投資
ハードウェアではなくソフトウェアが開発の鍵
器用な操作を実現するAIモデルが不可欠

「ロボット界のAndroid」構想

自社製ロボットMetabot」も開発
他社へソフトウェアをライセンス供与
プラットフォームで業界標準を狙う

専門家集団による開発体制

元Cruise CEOがチームを統括
MITなどからトップ人材を結集

Metaは、ヒューマノイドロボット開発を拡張現実(AR)に次ぐ大規模な投資対象と位置付けていることを明らかにしました。同社のアンドリュー・ボスワースCTOによると、数十億ドル規模を投じ、ハードウェアではなくソフトウェア開発に注力します。開発したプラットフォームを他社にライセンス供与する「ロボットAndroid」とも言える戦略で、急成長する市場の主導権を握る構えです。

なぜソフトウェアが重要なのでしょうか。ボスワース氏は「ハードウェアは難しくない。ボトルネックはソフトウェアだ」と断言します。ロボットがコップを絶妙な力加減で掴むといった器用な操作は極めて困難であり、この課題を解決するため、AIが現実世界をシミュレーションする「ワールドモデル」の構築が不可欠だと説明しています。

Metaの戦略は、自社でハードウェアを製造し販売することではありません。社内で「Metabot」と呼ばれるロボットを開発しつつも、その核心技術であるソフトウェアを他社ロボットメーカーに広くライセンス供与する計画です。これはGoogleAndroid OSでスマートフォン市場のエコシステムを築いた戦略と類似しており、オープンなプラットフォームで業界標準となることを目指します。

この野心的な計画を支えるのが、Metaが新設した「Superintelligence AI lab」です。このAI専門組織がロボティクスチームと緊密に連携し、ロボット知能を司るAIモデルを開発します。ボスワース氏は「このAIラボがなければ、このプロジェクトは実行しなかった」と述べ、AI開発能力が自社の最大の強みであるとの認識を示しました。

このアプローチは、テスラが開発する「Optimus」とは一線を画します。ボスワース氏は、人間の視覚を模倣してデータを集めるテスラの手法について「ロボット用のデータをどうやって十分に集めるのか疑問だ」と指摘。Metaシミュレーションワールドモデルを駆使して、このデータ問題を解決しようとしています。

Metaの本気度は、集結した人材からも伺えます。自動運転企業Cruiseの元CEOであるマーク・ウィッテン氏がチームを率い、MITから「現代最高の戦術ロボット工学者」と評されるキム・サンベ氏を招聘。社内のトップエンジニアも結集させ、盤石な体制でこの巨大プロジェクトに挑みます。

DeepMind、製造ロボット群を協調させるAI「RoboBallet」開発

Google DeepMindが、製造現場で複数のロボットアームの動きを自動で最適化するAIシステム「RoboBallet」を開発しました。従来は手作業で膨大な時間を要したタスク割り当て、スケジューリング、衝突回避という3つの難題をAIが同時に解決します。これにより、製造ラインのセットアップ時間を大幅に短縮し、生産性向上に貢献することが期待されます。 これまでの製造現場では、コンベアベルトに沿って配置されたロボットの動きは、専門家が手作業でプログラムしていました。この作業には数百から数千時間かかることも珍しくありません。特に、どのロボットがどの作業をどの順序で行うか、さらに互いに衝突しないように動作計画を立てることは、自動化が極めて困難な課題でした。 「RoboBallet」の革新性は、これまで個別に扱われてきた3つの難題を同時に解決する点にあります。DeepMindの研究者によれば、従来のツールは動作計画の一部を自動化できても、タスク割り当てとスケジューリングは手作業でした。この統合的なアプローチこそが、本研究の画期的な点と言えるでしょう。 開発チームは、まずシミュレーション環境でAIの学習を行いました。これは「ワークセル」と呼ばれる、ロボットチームが製品に対して作業を行うエリアを模したものです。この仮想空間内で、最大8台のロボットアームがテーブル上のアルミ製部品に対して最大40種類のタスクを完了するよう、AIは学習を重ねました。 シミュレーションのタスクでは、ロボットアーム先端(エンドエフェクタ)が正しい位置と角度で工作物に接近し、一定時間停止することが求められます。この停止は、溶接やネジ締めなどの実作業を想定したものです。AIは、このような複雑な動作の連携を衝突なく自律的に計画する能力を実証しました。

Skild AI、脚を失っても歩くロボット開発 汎用AIで損傷に適応

米国のAIスタートアップSkild AIが、脚を切断されるなど極端な物理的損傷を受けても動作し続けるロボットを制御する、汎用AIアルゴリズム「Skild Brain」を開発しました。この技術は、単一のAIが多様なロボットを操作し、未知の身体形状や損傷に即座に適応する画期的なものです。従来のデータ収集の課題を克服し、ロボット知能の飛躍的な進歩を目指します。 この技術の核心は「omni-bodied brain(万能ボディの脳)」というコンセプトです。共同創業者兼CEOのディーパック・パサック氏が提唱するこの考え方は、「あらゆるロボット、あらゆるタスクを単一の脳でこなす」というもの。特定のハードウェアやタスクに特化せず、極めて高い汎用性を持つAIモデルの構築が目的です。 従来のロボットAI開発では、シミュレーションや遠隔操作を通じて学習させていましたが、十分な量の多様なデータを集めることが大きな課題でした。Skild AIのアプローチは、多種多様な物理ロボットを単一のアルゴリズムで学習させることでこの問題を解決。これにより、AIは未知の状況にも対応できる、より一般的な能力を獲得します。 その適応能力は驚異的です。実験では、AIが学習データに含まれていないロボットの制御に成功。四足歩行ロボットを後ろ足だけで立たせると、まるで人間のように二足で歩き始めました。これは、AIが自身の身体状況をリアルタイムで把握し、最適な動作を自律的に判断していることを示唆しています。 さらに、脚を縛られたり、切断されたりといった極端な物理的変化にもAIは即座に適応しました。車輪を持つロボットのモーターを一部停止させても、残りの車輪でバランスを取りながら走行を継続。AIが持つ高い自己修正能力が実証された形です。この能力は、予測不可能な事態が起こりうる現場での活用に大きな可能性を秘めています。 この汎用技術は歩行ロボットに限りません。Skild AIは同様のアプローチをロボットアームの制御にも応用し、照明の急な変化といった環境変動にも対応できることを確認済みです。すでに一部の企業と協業しており、製造現場などでの実用化に向けた取り組みが始まっています。 市場からの評価も高く、同社は2024年に3億ドルを調達し、企業価値は15億ドルに達しました。トヨタ・リサーチ・インスティテュートなども汎用ロボットAIを開発していますが、多様なハードウェアへの対応力でSkild AIは際立っています。この技術は、ロボットの自律性を飛躍的に高める「物理的な超知能」の萌芽として期待されています。

MIT起業家、AIは加速装置 顧客との対話こそ事業の核心

マサチューセッツ工科大学(MIT)の学生起業家は、AIを事業開発の強力なツールとして活用しています。コーディングの高速化、プレゼンテーションの草案作成、新規市場のリサーチなど、日常業務にAIを組み込むことで、起業プロセスの効率と速度を大幅に向上させています。皆さんの会社では、どの業務にAIを応用できるでしょうか。 MIT起業家育成機関「マーティン・トラスト・センター」は、AIをあくまで「ツールキットの一つ」と位置づけています。AIによってタスクの実行方法は変わりましたが、起業の基本原則は不変だと強調します。AIは事業を加速させる「ジェットパック」のようなものですが、その操縦は起業家自身が行うべきだと指導しています。 AIの活用には注意も必要です。大規模言語モデルは平均的なデータに基づいており、特定の顧客層の深いニーズを捉えきれない場合があります。「平均的な顧客」向けの製品は、結果的に誰の心にも響かない可能性があるのです。AIの出力は鵜呑みにせず、必ず顧客の声で検証する姿勢が求められます。 学生の中には、事業の核にAIを据える「AIネイティブ」な企業も登場しています。例えば、ユーザー行動をAIでシミュレーションし、ウェブサイトなどの顧客体験を改善するツールを開発するCognify社。同社はアイデア出しから開発、市場投入戦略まで、あらゆるプロセスにAIを統合しています。 しかし、どれだけAIが進化しても、起業家が研究室や教室を飛び出し、顧客と直接対話する必要性は変わりません。顧客が誰で、何を求め、どうすればより良いサービスを提供できるか。この問いの答えは、AIだけでは見つけられないというのが、MITの一貫した考えです。 MIT学生支援のため、生成AIアプリ「Jetpack」も開発しました。これは、起業家精神の24のステップを対話形式で学べるツールです。顧客セグメントの提案や事業計画の立案を支援しますが、あくまで思考を助ける「初稿」を提供するものと位置づけられています。

AIエージェント性能向上へ、強化学習『環境』に投資が集中

シリコンバレーで、自律的にタスクをこなすAIエージェントの性能向上を目指し、強化学習(RL)で用いるシミュレーション「環境」への投資が急増しています。大手AIラボから新興企業までが開発に注力しており、次世代AI開発の鍵を握る重要技術と見なされています。従来の静的データセットによる学習手法の限界が背景にあります。 では、RL環境とは何でしょうか。これはAIがソフトウェア操作などを模擬した仮想空間で訓練を行うためのものです。例えばブラウザで商品を購入するタスクをシミュレートし、成功すると報酬を与えます。これにより、エージェントは試行錯誤を通じて実践的な能力を高めるのです。 この分野への需要は急拡大しており、大手AIラボはこぞって社内でRL環境を構築しています。The Informationによれば、Anthropicは来年RL環境に10億ドル以上を費やすことを検討しており、業界全体の投資熱の高さを示しています。AI開発競争の新たな主戦場となりつつあります。 この好機を捉え、RL環境に特化した新興企業も登場しています。Mechanize社はAIコーディングエージェント向けの高度な環境を提供。Prime Intellect社はオープンソース開発者向けのハブを立ち上げ、より幅広い開発者が利用できるインフラ構築を目指しています。 データラベリング大手もこの市場シフトに対応しています。Surge社は需要増を受け、RL環境構築専門の組織を設立。評価額100億ドルとされるMercor社も同様に投資を強化し、既存の顧客基盤を活かして市場での地位を固めようとしています。 ただし、この手法の有効性には懐疑的な見方もあります。専門家は、AIが目的を達成せずに報酬だけを得ようとする「報酬ハッキング」のリスクを指摘。AI研究の進化は速く、開発した環境がすぐに陳腐化する懸念もあります。スケーラビリティへの課題も残り、今後の進展が注目されます。

NVIDIA、クラウドゲームに新作11本追加、日本で高性能版提供開始

NVIDIAは9月18日、同社のクラウドゲーミングサービス「GeForce NOW」に、「Dying Light: The Beast」を含む11本の新作ゲームを追加したと発表しました。これにより、ユーザーは高性能なゲーミングPCを所有していなくても、様々なデバイスで最新のゲームタイトルを快適に楽しむことができます。サービスの魅力向上とユーザー体験の強化が狙いです。 今回のアップデートで特に注目されるのは、人気サバイバルホラーシリーズの最新作「Dying Light: The Beast」です。高速なパルクールと戦闘が特徴の本作を、GeForce NOWを通じてクラウドから直接ストリーミングできます。デバイスの性能に依存せず、映画のような映像と高速なロード時間を体験できるのが強みです。 日本のユーザーにとって重要なのは、GeForce RTX 5080クラスの性能を提供するサーバーが日本でも稼働を開始した点です。これにより、国内ユーザーはこれまで以上に低遅延で高品質なクラウドゲーミングを享受できるようになります。NVIDIAは今後も世界各地域でサーバーのアップグレードを進める計画で、サービスの競争力強化を図ります。 新作には、SEGAの経営シミュレーションゲーム「Two Point Campus」や「Two Point Museum」、Ubisoftの「Assassin’s Creed Shadows」の最新拡張コンテンツ「Claws of Awaji」なども含まれます。多様なジャンルのタイトルを拡充することで、幅広いゲーマー層のニーズに応えていく方針です。 NVIDIAはRTX 5080対応タイトルの拡充にも力を入れています。「Dying Light: The Beast」に加え、「Kingdom Come: Deliverance II」や「Monster Hunter Wilds」などが既に対応済みです。クラウド上で最新技術を活用できるゲームが増えることで、サービスの付加価値はさらに高まるでしょう。

最先端AIセキュリティのIrregular、8000万ドル調達しリスク評価強化

巨額調達と評価額

調達額は8,000万ドルに到達
評価額4.5億ドルに急伸
Sequoia CapitalやRedpoint Venturesが主導

事業の核心と評価手法

対象は最先端(フロンティア)AIモデル
AI間の攻撃・防御シミュレーションを実施
未発見の潜在的リスクを事前に検出
独自の脆弱性評価フレームワーク「SOLVE」を活用
OpenAIClaudeの評価実績を保有

AIセキュリティ企業Irregular(旧Pattern Labs)は、Sequoia Capitalなどが主導するラウンドで8,000万ドルの資金調達を発表しました。企業価値は4.5億ドルに達し、最先端AIモデルが持つ潜在的なリスクと挙動を事前に検出・評価する事業を強化します。

共同創業者は、今後の経済活動は人間対AI、さらにはAI対AIの相互作用が主流になり、従来のセキュリティ対策では対応できなくなると指摘しています。これにより、モデルリリース前に新たな脅威を見つける必要性が高まっています。

Irregularが重視するのは、複雑なシミュレーション環境を構築した集中的なストレス試験です。ここではAIが攻撃者と防御者の両方の役割を担い、防御が崩壊する箇所を徹底的に洗い出します。これにより、予期せぬ挙動を事前に発見します。

同社はすでにAI評価分野で実績を築いています。OpenAIのo3やo4-mini、Claude 3.7 Sonnetなどの主要モデルのセキュリティ評価に採用されています。また、脆弱性検出能力を測る評価フレームワーク「SOLVE」は業界標準として広く活用されています。

AIモデル自体がソフトウェアの脆弱性を見つける能力を急速に高めており、これは攻撃者と防御者の双方にとって重大な意味を持ちます。フロンティアAIの進化に伴い、潜在的な企業スパイ活動など、セキュリティへの注目はますます集中しています。

Hugging Face、ロボット学習用データの大規模ストリーミングに対応

V3.0の主要機能

数百万エピソード対応のスケーラビリティ向上
大容量データをダウンロード不要で処理可能
複数エピソードを単一ファイルに集約(ファイル数削減)
関係メタデータによるエピソード単位の検索

ロボティクスデータ対応

センサー運動、複数カメラフィードなどに対応
PyTorchとのシームレスな統合
時系列データを扱うためのネイティブなウィンドウ操作
実機からシミュレーションまで広範にサポート

Hugging Faceは、ロボット学習向けデータセットフォーマット「LeRobotDataset:v3.0」をリリースしました。これは、数百万エピソードに及ぶ超大規模なロボティクスデータの取り扱いを根本的に改善するものです。旧バージョンで課題だったファイルシステムの制約を克服し、大容量データをディスクにダウンロードせずに処理できるストリーミング機能にネイティブ対応しました。この進化は、ロボティクス分野におけるAI学習の民主化を大きく加速します。

V3.0の最大の設計上の変更点は、スケーラビリティの確保です。従来、エピソードごとにファイルを保存していたため、エピソード数が増加するとファイルシステムに過大な負荷がかかっていました。新フォーマットでは、複数のエピソードを単一のファイルに集約し、リレーショナルメタデータを用いてエピソード単位の情報を効率的に検索します。これにより、大規模データセットの管理が大幅に簡素化されました。

新たに導入されたストリーミング機能は、ロボット学習のアクセシビリティを劇的に向上させます。専用の`StreamingLeRobotDataset`インターフェースを利用することで、ユーザーはテラバイト級のデータをローカルにダウンロードすることなく、Hugging Face Hubから直接データバッチをオンザフライで処理できます。これは、特にリソースが限られた環境での研究開発に貢献します。

データは効率的な構造で保存されます。低次元のセンサーデータやアクションはApache Parquetファイルに、大量のカメラ映像はMP4ファイルに連結・エンコードされます。また、本フォーマットはHugging FaceとPyTorchのエコシステムに統合されており、ロボット学習特有の時系列データのウィンドウ処理(過去の観測のスタック)をネイティブにサポートしている点も特徴的です。

OpenAI、AGIへ「人型ロボットAI」開発を急加速

AGI実現への新経路

AGI実現へ物理世界での行動を重視
LLMの限界を認め新たな研究領域へ移行
人型ロボットAIの汎用化を目標に設定

開発体制と技術基盤

人型ロボット研究の専門家を積極採用
遠隔操作とシミュレーションで訓練
Nvidia Isaacなど開発環境を導入

ハード開発の可能性

試作・構築経験を持つ機械エンジニアを募集
量産化を視野に入れたハードウェア設計を示唆

OpenAIAGI(汎用人工知能)達成に向け、ロボティクス研究を本格的に再加速させています。特に、物理世界との相互作用を可能にする人型ロボットAIの開発に注力するため、スタンフォード大学などから専門家を積極的に採用していることが明らかになりました。これは、既存のLLMモデルの限界を超え、AIを次の段階へ進めるための戦略的な転換です。

同社は、AGIを実現するには、単なる対話や推論能力だけでなく、現実世界でタスクを実行できるアルゴリズムが必要だと判断しました。このため、大規模言語モデル(LLM)の発展がピークに達しつつあると見て、物理的な感覚や運動制御を伴う新たな研究分野に焦点を移しています。

採用された研究者たちは、人型や部分的に人型をしたロボットを制御するAIアルゴリズム開発の専門家です。求人情報からは、ロボットを人間が操作し、その動きをAIが学習するテレイグジスタンス(遠隔操作)シミュレーションを用いた訓練システムの構築を進めていることが分かります。

具体的には、ロボット訓練に広く使われるNvidia Isaacなどの仮想物理環境シミュレーション技術の専門知識が求められています。これにより、現実世界での試行錯誤コストを削減しつつ、AIが複雑な環境に適応する能力を効率的に獲得することが期待されます。

OpenAIが自社でロボットを製造するか、既存のハードウェアを活用するかは不明確です。しかし、求人には、センサー付きロボットシステムの試作・構築経験を持つ機械エンジニアの募集があり、量産(100万台以上)を前提とした設計経験も要求されており、ハードウェアへの深い関与を示唆しています。

このロボティクスへの再参入は、競争が激化する市場への挑戦です。すでにFigureやAgilityなどのスタートアップに加え、テスラやGoogleといった巨大AI企業も人型ロボット開発に大規模な投資を行っています。現時点では、OpenAI「魔法のような優位性はない」との指摘もあり、今後の技術開発競争に注目が集まっています。