基盤モデル(LLM技術)に関するニュース一覧

SAP、調整不要の表計算AI発表 業務予測を即実現

「調整不要」の表計算AI

導入後すぐに予測分析へ活用
数十年のビジネスデータで学習

LLMとの明確な違い

テキストでなく表データから学習
数値間の関係性を深く理解
構造的で正確な回答を生成

提供計画と今後の展望

2025年第4四半期に一般提供
ノーコード環境での実験も可能

独ソフトウェア大手のSAPは、企業のAI導入を簡素化する新たな基盤モデル「RPT-1」を発表しました。このモデルは表形式データに特化しており、従来のLLMのように時間とコストのかかるファインチューニングが不要な点が最大の特徴です。導入後すぐに予測分析などの高度な業務に活用できるとしており、2025年第4四半期の一般提供開始を予定しています。

RPT-1は「リレーショナル基盤モデル」と名付けられ、リレーショナルデータベースやExcelのようなスプレッドシートのデータから学習します。SAPが数十年にわたり蓄積したビジネス取引データを基に事前学習済みのため、企業は自社の個別データを追加学習させることなく、「すぐに使える(out-of-the-box)」状態で業務アプリケーションに直接組み込むことが可能です。

テキストやコードを学習する大規模言語モデル(LLM)とは一線を画します。RPT-1は、数値や異なるセル間の関係性を深く理解することで、より構造的で正確な回答を生成できます。この特性は、特に金融分野や企業の業績管理など、精密な分析が求められる業務で真価を発揮するでしょう。汎用LLMでは対応が難しいユースケースを切り拓きます。

このモデルの基盤となっているのは、SAPの研究者が提唱した「ConTextTab」というアーキテクチャです。これは、テーブルのヘッダーや列の型といった意味情報(セマンティックシグナル)を手がかりに学習を進めることで、データ間の関連性を構造的に把握します。この仕組みが、RPT-1の精度の高さを支えています。

RPT-1は2025年第4四半期に、SAPのAI基盤サービス「AI Foundation」を通じて一般提供が開始される予定です。また、専門家でなくてもモデルを試せるノーコードの実験環境(プレイグラウンド)も提供されます。SAPは今後、オープンソースモデルを含む他のモデルも順次リリースする計画で、企業のAI活用をさらに加速させそうです。

NVIDIA、フィジカルAI設計図で都市DXを加速

フィジカルAI設計図とは

デジタルツインとAIを統合
現実世界をOmniverseで再現
合成データでAIモデルを訓練
リアルタイムの映像解析を実現

グローバルな都市での実装

交通管理やインフラ監視に活用
ダブリンやホーチミン市で導入
Esriなど多様なパートナーと連携
インシデント対応時間を80%削減

NVIDIAは、バルセロナで開催中の「スマートシティエキスポ」で、都市が抱える課題を解決する「フィジカルAIブループリント」を発表しました。この設計図は、デジタルツイン技術と最新のAIを組み合わせ、交通渋滞の緩和やインフラ管理の効率化を実現します。Esriやデロイトといったグローバルパートナーとの協業を通じて、すでに世界各国の都市で具体的な成果を上げています。

「フィジカルAIブループリント」の中核をなすのが、現実世界を仮想空間に忠実に再現するデジタルツイン技術「NVIDIA Omniverse」です。ここに、世界基盤モデルNVIDIA Cosmos」や映像解析AI「NVIDIA Metropolis」を統合。これにより、現実では困難なシミュレーションや、高精度なAIモデルの迅速な訓練が可能になります。

なぜ今、都市DXが急務なのでしょうか。国連は2050年までに世界人口の3分の2が都市に集中すると予測しており、インフラや公共サービスへの負荷増大は避けられません。特にスマート交通管理市場は2027年までに200億ドル規模に達する見込みで、AI活用による効率化は都市の持続可能性を左右する重要な鍵となります。

パートナー企業による導入事例も次々と生まれています。例えば、地理情報システムのEsriは、ノースカロライナ州ローリー市で、膨大なカメラデータをAIがリアルタイムで分析し、交通状況を地図上に可視化するシステムを構築。これにより、問題発生時の迅速な対応や、渋滞緩和によるCO2排出量削減を目指します。

台湾のLinker Visionは、このブループリントを全面的に採用し、高雄市でインシデント対応時間を最大80%削減する成果を上げました。この成功を足掛かりに、ベトナムのホーチミン市やダナン市へも展開。交通量や建設状況をシミュレーション・監視し、都市の運営効率を飛躍的に高めようとしています。

他にも、アイルランドのダブリンでは、Bentley SystemsやVivaCityが協力し、自転車や歩行者などの移動データをデジタルツイン上で分析。また、デロイトはAIによる横断歩道の自動点検システムを開発するなど、世界中のエコシステムパートナーNVIDIAの技術基盤の上で革新的なソリューションを生み出しています。

NVIDIAとそのパートナーが示す未来は、データとAIが都市の神経網のように機能し、より安全で効率的な市民生活を実現する世界です。この「フィジカルAI」という新たな潮流は、都市運営のあり方を根本から変革する可能性を秘めており、経営者エンジニアにとって見逃せない動きと言えるでしょう。

確実性でLLM超え狙うAI、30億円調達

ポストTransformer技術

LLMの言語能力と記号AIの論理推論を融合
ニューロシンボリック方式を採用
確率的なLLMの予測不能性を克服
タスク指向の対話に特化した設計

企業AUIと新モデル

NYの新興企業、評価額1125億円
基盤モデル「Apollo-1」を開発
総調達額は約90億円に到達
2025年末に一般提供を予定

ニューヨークのAIスタートアップ、Augmented Intelligence Inc (AUI)は2025年11月3日、2000万ドル(約30億円)の資金調達を発表しました。これにより企業評価額は7億5000万ドル(約1125億円)に達します。同社は、ChatGPTなどが用いるTransformerアーキテクチャの課題である予測不可能性を克服するため、ニューロシンボリックAI技術を開発。企業が求める確実で信頼性の高い対話AIの実現を目指します。

AUIが開発する基盤モデル「Apollo-1」の核心は、そのハイブリッドな構造にあります。ユーザーの言葉を理解する「ニューラルモジュール」と、タスクの論理構造を解釈し、次に取るべき行動を決定論的に判断する「シンボリック推論エンジン」を分離。これにより、LLMの持つ言語の流暢さと、従来型AIの持つ厳密な論理実行能力を両立させています。

なぜ今、この技術が注目されるのでしょうか。既存のLLMは確率的に応答を生成するため、常に同じ結果を保証できません。これは、金融やヘルスケア顧客サービスなど、厳格なルール遵守が求められる業界では大きな障壁となります。Apollo-1は、組織のポリシーを確実に適用し、タスクを最後まで間違いなく遂行する能力でこの課題を解決します。

Apollo-1の強みは、その汎用性と導入のしやすさにもあります。特定の業界に特化せず、ヘルスケアから小売まで幅広い分野で応用可能です。また、特別なインフラを必要とせず、標準的なクラウド環境で動作するため、導入コストを抑えられる点も企業にとっては魅力的です。開発者は使い慣れたAPI経由で簡単に統合できます。

今回の調達は、より大規模な資金調達の前段階と位置付けられており、同社への期待の高さをうかがわせます。Fortune 500企業の一部では既にベータ版が利用されており、2025年末までの一般公開が予定されています。LLM一強の時代から、用途に応じた多様なAIが選択される新時代への転換点となるかもしれません。

Apple CEO、AI分野のM&Aに意欲表明

AI強化へ3本柱の方針

AI分野でのM&A;や提携に前向き
自社開発・提携買収3本柱を継続
OpenAIに続く新たな提携も準備

次世代Siriと独自技術

AI搭載の次世代Siriは2026年公開予定
独自技術Private Cloud Compute活用
AI機能がスマホ選びの重要要素

Appleのティム・クックCEOは、2025年第4四半期の決算発表において、AI分野でのM&A;(合併・買収)や提携に前向きな姿勢を改めて示しました。同社はAI開発を加速させるため、戦略的な選択肢を常に検討していると強調。また、AIを搭載した次世代Siriが2026年にリリース予定であることも明言し、開発が順調に進んでいることを投資家にアピールしました。

クックCEOは、AppleのAI開発が「自社基盤モデル」「サードパーティとの提携」「企業買収」の3本柱で進められていることを再確認しました。「我々のロードマップを前進させるM&A;であれば、追求する用意がある」と述べ、市場を継続的に監視している姿勢を明らかにしました。これは、AI分野での競争力維持に向けた強い意志の表れと言えるでしょう。

パートナーシップの拡大にも意欲的です。AppleはすでにOpenAI提携し、ChatGPTSiriや「Apple Intelligence」に統合しています。クックCEOは決算発表前のインタビューで「将来的には、より多くの企業と統合していく」と語っており、特定の技術に固執せず、最適なパートナーと協力していく戦略を明確にしました。

自社技術の中核となるのが、プライバシー保護に特化したクラウドシステム「Private Cloud Compute」です。クックCEOは、この技術がすでに多くのSiriのクエリ処理に使われていると説明。このインフラを支えるサーバーの製造も数週間前にヒューストンで開始されており、データセンターでの活用に向けた増産体制が計画されています。

最後にクックCEOは、AI機能が消費者のスマートフォン選びに与える影響についても言及しました。「Apple Intelligenceは(購入の)一因であり、今後さらに大きな要因になると非常に強気に見ている」と述べ、AI機能が製品の競争力を左右する重要な要素になるとの認識を示しました。

OpenAI、推論で安全性を動的分類する新モデル公開

新モデルの特長

開発者安全方針を直接定義
推論ポリシーを解釈し分類
判断根拠を思考過程で透明化
商用利用可能なオープンモデル

従来手法との違い

ポリシー変更時の再学習が不要
大量のラベル付きデータが不要
新たな脅威へ迅速な対応が可能

性能と実用上の課題

小型ながら高い分類性能を発揮
処理速度と計算コストが課題

OpenAIは2025年10月29日、開発者が定義した安全方針に基づき、AIが推論を用いてコンテンツを動的に分類する新しいオープンウェイトモデル「gpt-oss-safeguard」を発表しました。このモデルは、従来の大量データに基づく分類器とは異なり、ポリシー自体を直接解釈するため、柔軟かつ迅速な安全対策の導入を可能にします。研究プレビューとして公開され、コミュニティからのフィードバックを募ります。

最大の特徴は、AIの「推論能力」を活用する点です。開発者は自然言語で記述した安全方針を、分類対象のコンテンツと共にモデルへ入力します。モデルは方針を解釈し、コンテンツが方針に違反するかどうかを判断。その結論に至った思考の連鎖(Chain-of-Thought)」も示すため、開発者は判断根拠を明確に把握できます。

このアプローチは、従来の機械学習手法に比べて大きな利点があります。従来、安全方針を変更するには、数千件以上の事例データを再ラベル付けし、分類器を再学習させる必要がありました。しかし新モデルでは、方針テキストを修正するだけで対応可能です。これにより、巧妙化する新たな脅威や、文脈が複雑な問題にも迅速に適応できます。

例えば、ゲームのコミュニティサイトで不正行為に関する投稿を検出したり、ECサイトで偽レビューを特定したりと、各サービスの実情に合わせた独自の基準を容易に設定・運用できます。大規模なデータセットを用意できない開発者でも、質の高い安全分類器を構築できる道が開かれます。

性能評価では、社内ベンチマークにおいて、基盤モデルである「gpt-5-thinking」を上回る精度を示しました。一方で、特定の複雑なリスクに対しては、大量のデータで専用に訓練された従来の分類器に劣る場合があることや、推論プロセスに伴う計算コストと処理遅延が課題であることも認めています。

OpenAIは、社内ツール「Safety Reasoner」で同様のアプローチを既に採用しており、GPT-5画像生成AI「Sora 2」などの安全システムの中核を担っています。今回のオープンモデル公開は、こうした先進的な安全技術を広く共有し、コミュニティと共に発展させることを目指すものです。モデルはHugging Faceからダウンロード可能で、Apache 2.0ライセンスの下で自由に利用、改変、配布ができます。

NVIDIA、物理AI開発を加速する新基盤モデル

物理AI開発の課題

現実世界のデータ収集コスト
開発期間の長期化
多様なシナリオの網羅性不足

新Cosmosモデルの特長

テキスト等から動画世界を生成
気象や照明など環境を自在に変更
従来比3.5倍小型化し高速化

期待されるビジネス効果

開発サイクルの大幅な短縮
AIモデルの精度と安全性の向上

NVIDIAは2025年10月29日、物理AI開発を加速させるワールド基盤モデルNVIDIA Cosmos」のアップデートを発表しました。ロボットや自動運転車の訓練に必要な多様なシナリオのデータを、高速かつ大規模に合成生成する新モデルを公開。これにより、開発者は現実世界でのデータ収集に伴うコストや危険性を回避し、シミュレーションの精度を飛躍的に高めることが可能になります。

ロボットなどの物理AIは、現実世界の多様で予測不能な状況に対応する必要があります。しかし、そのための訓練データを実世界で収集するのは、莫大な時間とコスト、そして危険を伴います。特に、まれにしか起こらない危険なシナリオを網羅することは極めて困難です。この「データ収集の壁」を打ち破る鍵として、物理法則に基づいた合成データ生成が注目されています。

今回のアップデートでは、2つの主要モデルが刷新されました。「Cosmos Predict 2.5」は、テキストや画像動画から一貫性のある仮想世界を動画として生成します。一方「Cosmos Transfer 2.5」は、既存のシミュレーション環境に天候や照明、地形といった新たな条件を自在に追加し、データの多様性を飛躍的に高めます。モデルサイズも従来比3.5倍小型化され、処理速度が向上しました。

これらの新モデルは、NVIDIAの3D開発プラットフォーム「Omniverse」やロボットシミュレーション「Isaac Sim」とシームレスに連携します。開発者は、スマートフォンで撮影した現実空間からデジタルツインを生成し、そこに物理的に正確な3Dモデルを配置。その後、Cosmosを用いて無限に近いバリエーションの訓練データを生成する、という効率的なパイプラインを構築できます。

すでに多くの企業がこの技術の活用を進めています。汎用ロボット開発のSkild AI社は、ロボットの訓練期間を大幅に短縮。また、配送ロボットを手がけるServe Robotics社は、Isaac Simで生成した合成データを活用し、10万件以上の無人配送を成功させています。シミュレーションと現実のギャップを埋めることで、開発と実用化のサイクルが加速しています。

NVIDIAの今回の発表は、物理AI開発が新たな段階に入ったことを示唆します。合成データ生成の質と量が飛躍的に向上することで、これまで困難だった複雑なタスクをこなすロボットや、より安全な自動運転システムの開発が現実味を帯びてきました。経営者やリーダーは、この技術革新が自社の競争優位性にどう繋がるか、見極める必要があります。

NVIDIA、AI工場設計図と新半導体を一挙公開

AI工場構築の設計図

政府向けAI工場設計図を公開
ギガワット級施設のデジタルツイン設計
次世代DPU BlueField-4発表
産業用AIプロセッサ IGX Thor

オープンなAI開発

高効率な推論モデルNemotron公開
物理AI基盤モデルCosmosを提供
6G研究用ソフトをオープンソース化

NVIDIAは10月28日、ワシントンD.C.で開催の技術会議GTCで、政府・規制産業向けの「AIファクトリー」参照設計や次世代半導体、オープンソースのAIモデル群を一挙に発表しました。これは、セキュリティが重視される公共分野から創薬エネルギー、通信といった基幹産業まで、AIの社会実装をあらゆる領域で加速させるのが狙いです。ハード、ソフト、設計思想まで網羅した包括的な戦略は、企業のAI導入を新たな段階へと導く可能性があります。

発表の核となるのが、AI導入の設計図です。政府・規制産業向けに高いセキュリティ基準を満たす「AI Factory for Government」を発表。PalantirやLockheed Martinなどと連携します。また、Omniverse DSXブループリントは、ギガワット級データセンターデジタルツインで設計・運用する手法を提示。物理的な建設前に効率や熱問題を最適化し、迅速なAIインフラ構築を可能にします。

AIインフラの性能を根幹から支える新半導体も発表されました。次世代DPU「BlueField-4」は、AIデータ処理、ネットワーキング、セキュリティを加速し、大規模AI工場の中枢を担います。さらに、産業・医療のエッジ向けには、リアルタイム物理AIプロセッサ「IGX Thor」を投入。従来比最大8倍のAI性能で、工場の自動化や手術支援ロボットの進化を後押しします。

開発者エコシステムの拡大に向け、AIモデルのオープンソース化も加速します。高効率な推論でAIエージェント構築を容易にする「Nemotron」モデル群や、物理世界のシミュレーションを可能にする「Cosmos」基盤モデルを公開。さらに、次世代通信規格6Gの研究開発を促進するため、無線通信ソフトウェア「Aerial」もオープンソースとして提供します。

これらの技術は既に具体的な産業応用へと結実しています。製薬大手イーライリリーは、1000基以上のNVIDIA Blackwell GPUを搭載した世界最大級の創薬AIファクトリーを導入。General Atomicsは、核融合炉のデジタルツインを構築し、シミュレーション時間を数週間から数秒に短縮するなど、最先端科学の現場で成果を上げています。

今回の一連の発表は、AIが研究開発段階から、社会を動かす基幹インフラへと移行する転換点を示唆しています。NVIDIAが提示する「AIファクトリー」という概念は、あらゆる産業の生産性と競争力を再定義する可能性を秘めています。自社のビジネスにどう取り入れ、新たな価値を創造するのか。経営者やリーダーには、その構想力が問われています。

米政府、AMDと組み国家主権AIスパコン開発へ

10億ドルの大型プロジェクト

エネルギー省とAMDが提携
総額10億ドルの契約を締結
2基のAIスパコンを開発
オークリッジ国立研究所に設置

2基の新スパコンの役割

Lux:国家初のAIファクトリー
Luxは2026年初頭に稼働
Discovery:科学研究を加速
Discoveryは2029年稼働予定

半導体大手AMDは10月27日、米エネルギー省と10億ドル規模の契約を締結したと発表しました。この提携に基づき、テネシー州のオークリッジ国立研究所に2基のAIスーパーコンピュータ「Lux」と「Discovery」を開発します。「Lux」は2026年初頭、「Discovery」は2029年の稼働を目指しており、米国の科学技術と国家安全保障の強化が目的です。

「Lux」は、米国初となる科学、エネルギー、国家安全保障に特化した「AIファクトリー」と位置づけられています。AI基盤モデルの訓練や微調整、展開に特化しており、データ集約的なワークロードに最適化された設計です。これにより、発見や技術革新を加速させることが期待されます。

一方の「Discovery」は、エネルギー、生物学、先端材料、製造業など、幅広い分野での画期的な研究を推進します。次世代原子炉やバッテリー、半導体などの設計支援が主な用途です。「Bandwidth Everywhere」設計により、既存のスパコン「Frontier」を上回る性能とエネルギー効率を実現します。

AMDと米政府の協力は今回が初めてではありません。同研究所に設置されている世界最速級のスパコン「Frontier」の開発にもAMDは関与しています。今回のプロジェクトは、これまでの協力関係を基盤とし、米国のAI覇権と科学技術力をさらに強化する戦略的な一手と言えるでしょう。

OpenAI、韓国AI成長戦略を提言 『主権』と『協力』が鍵

韓国の強みと機会

世界有数の半導体製造能力
高密度なデジタルインフラ
政府主導のAI国家戦略

OpenAIのデュアル戦略

自国のAI主権を構築
最先端企業との戦略的協力

主要分野への波及効果

輸出・製造業の競争力向上
医療・教育の高度化と効率化
中小企業・地方経済の活性化

OpenAIは10月23日、韓国がAIによる経済的利益を最大化するための政策提言「経済ブループリント」を発表しました。韓国が持つ半導体製造能力やデジタルインフラといった強みを活かし、世界有数のAI大国へと飛躍するための道筋を示すものです。提言の核心は、自国でAI基盤を固める「AI主権」の構築と、最先端企業と連携する「戦略的協力」を両立させるアプローチにあります。

なぜ今、韓国が注目されるのでしょうか。同国は世界トップクラスの半導体製造技術、高密度なデジタルインフラ、優秀な人材、そしてAIを国家の優先課題とする政府の強力な支援という、AI先進国となるための要素を兼ね備えています。OpenAIは既にサムスンやSKと連携し、次世代AIデータセンターの構築も視野に入れています。

提言の中心となるのが「デュアルトラック・アプローチ」です。一つは、基盤モデルインフラ、データ統治において自国の能力を高める「AI主権」の追求。もう一つは、OpenAIのような最先端AI開発者と協業し、最新技術へのアクセスを確保する「戦略的協力」です。これらは相互に補完し合い、韓国独自のAIエコシステムを強化すると分析されています。

この戦略が実現すれば、経済全体に大きな効果が期待されます。例えば、半導体や自動車といった輸出産業では、AIによる設計最適化やスマート工場化で国際競争力が高まります。また、高齢化が進む医療分野では臨床医の負担軽減、教育分野では個別最適化された学習の提供が可能になるでしょう。

中小企業や地方経済の活性化も重要なテーマです。手頃な価格のAIアシスタントが事務作業や輸出関連手続きを代行することで、中小企業はより付加価値の高い業務に集中できます。これにより、ソウル一極集中ではない、均衡の取れた成長を促進する狙いがあります。

成功の鍵は「安全な導入のスピード」です。そのためには、大規模な計算インフラの整備、データガバナンスの確立、国際標準に準拠した政策環境の整備が不可欠となります。これらを迅速に進めることで、韓国は単なるAI導入国に留まらず、他国に輸出可能な「AI国家パッケージ」を開発できるとOpenAIは見ています。

OpenAIのクリス・レヘインCGAO(最高国際渉外責任者)は「韓国はその強みを活かし、歴史的なリーダーシップを発揮する機会を得た」とコメント。このブループリントは、韓国がAI分野で世界をリードする「標準設定者」となるための、具体的かつ野心的なロードマップと言えるでしょう。

3Dで思考するロボットAI、欧州からオープンソースで登場

3Dデータで物理世界を理解

3Dデータを取り入れた独自学習
物理空間における物体の動きを把握
2D画像ベースモデルとの明確な差別化

商用版に匹敵する性能

オープンソースで誰でも利用可能
研究開発の加速と民主化に貢献
ベンチマーク商用モデル並みのスコア
スタートアップ実験・改良を促進

ブルガリアの研究所INSAITを中心とする欧州の研究者チームが22日、産業用ロボットの頭脳として機能する新たなAI基盤モデル「SPEAR-1」をオープンソースで公開しました。このモデルは3次元(3D)データで訓練されており、物体をより器用に掴み、操作する能力を飛躍的に向上させます。研究開発の加速が期待されます。

SPEAR-1の最大の特徴は、3Dデータを学習に取り入れた点です。従来のモデルは2D画像から物理世界を学んでいましたが、これではロボットが活動する3D空間との間に認識のズレが生じていました。このミスマッチを解消し、より現実に即した物体の動きを理解します。

このモデルがオープンソースで公開された意義は大きいでしょう。言語モデルの世界でLlamaなどが革新を民主化したように、SPEAR-1はロボット工学の研究者やスタートアップ迅速に実験を重ねる土台となります。身体性を持つAI分野の発展を加速させる起爆剤となりそうです。

性能も注目に値します。ロボットのタスク遂行能力を測るベンチマーク「RoboArena」では、商用の基盤モデルに匹敵する高いスコアを記録しました。特に、有力スタートアップPhysical Intelligence社の最先端モデルにも迫る性能を示しており、その実用性の高さが伺えます。

ロボット知能の開発競争は激化し、数十億ドル規模の資金が動いています。SPEAR-1の登場は、クローズドな商用モデルとオープンソースモデル共存しながら技術を進化させる可能性を示唆します。専門家は「1年前には不可能だった」と述べ、この分野の急速な進歩に驚きを見せています。

MITとIBM、小型・効率AIで産業応用を加速

産学連携が生む圧倒的成果

特許54件、引用12万件超
産業ユースケース50件以上を創出
医療や化学など多分野へ応用

「巨大」から「小型・効率」へ

巨大モデルからタスク特化型へ転換
性能を維持しモデルを小型化
エッジデバイスでの高速処理実現

少ないデータで賢く学習

自己修正で推論精度を高める新手法
PoCで終わらせない実用化を推進

マサチューセッツ工科大学(MIT)とIBMが共同で運営する「MIT-IBM Watson AI Lab」は、AI開発の新たな方向性を示しています。設立8周年を迎えた同ラボは、巨大な基盤モデルから、より小さく効率的でタスクに特化したモデルの開発に注力。研究と実用化のギャップを埋め、産業界でのAI活用を加速させることを目指します。これは、AIプロジェクトの多くが概念実証(PoC)で頓挫する現状への明確な回答と言えるでしょう。

この産学連携は目覚ましい成果を上げています。これまでに特許54件を出願し、論文の引用数は12万8000件を超えました。さらに、ヘルスケアや金融、化学など多岐にわたる分野で50件以上の産業ユースケースを創出。AI画像技術によるステント留置の改善や、計算コストの大幅な削減など、具体的なイノベーションを生み出し続けています。

なぜ今、「小型・効率化」が重要なのでしょうか。調査会社ガートナーによると、生成AIプロジェクトの少なくとも30%が2025年末までに概念実証(PoC)の段階で中止されると予測されています。多くの企業がAIへの期待を抱きつつも、価値ある成果に繋げられていないのです。同ラボは、この研究と実用の間の「死の谷」を埋める役割を担っています。

小型化の鍵を握るのが、`once-for-all`や`AWQ`といった革新的な技術です。これらの手法は、モデルのアーキテクチャを最適化し、性能を維持したままサイズを圧縮します。これにより、スマートフォンなどのエッジデバイス上でもAIを高速に実行できるようになります。遅延を減らし、リアルタイムでの応用範囲を大きく広げる可能性を秘めています。

さらに、少ないデータで賢く学習する技術も進化しています。例えば`COAT`(Chain-of-Action-Thought)と呼ばれる手法は、AIが自らの推論プロセスを反復的に自己修正することで、より正確な答えを導き出します。これは、限られた計算資源とデータで、現実世界の複雑な課題を解決するための重要なアプローチです。

これらの研究成果は、IBMのプラットフォーム`watsonx`などを通じて実用化されています。一例が、コンパクトながら高精度な文書理解能力を持つ`Granite Vision`モデルです。企業が保有する膨大な文書から、信頼性の高い情報を抽出し、要約するニーズに応えます。

MIT-IBM Watson AI Labが目指すのは「有用で効率的な知能」の創出です。巨大モデルの開発競争から一歩進み、目的に合わせて最適化されたAIこそが、真の経済的・社会的価値を生み出すと彼らは考えています。この産学連携の取り組みは、AIの実用化を目指す全ての企業にとって、重要な指針となるでしょう。

GoogleのAI、がん治療の新たな道を拓く

新AIモデル「C2S-Scale」

GoogleGemmaベースで開発
270億パラメータの大規模モデル
個々の細胞の言語を解読

がん治療への新アプローチ

免疫から隠れる「コールド」腫瘍が標的
4000超の薬剤を仮想スクリーニング
新薬候補silmitasertibを特定

AIの予測を実験で証明

AIの仮説を実験室で検証
免疫反応を約50%増強する効果を確認

Googleとイェール大学の研究チームは、オープンソースAIモデル「Gemma」を基に開発した新モデル「C2S-Scale 27B」を用い、がん治療の新たな経路を発見しました。このAIは、これまで免疫システムから見えなかった「コールド」腫瘍を、免疫が攻撃しやすい「ホット」な状態に変える可能性のある薬剤候補を特定。実験でもその効果が確認され、がん免疫療法の開発を加速させるブレークスルーとして期待されています。

今回開発された「C2S-Scale 27B」は、270億という膨大なパラメータを持つ基盤モデルです。個々の細胞が発する複雑な「言語」を解読するために設計されました。特筆すべきは、モデルの大規模化によって獲得された「創発的能力」です。これにより、小規模モデルでは不可能だった、特定の条件下でのみ薬が効果を発揮する、という複雑な因果関係の推論が可能になりました。

がん免疫療法の大きな課題は、多くの腫瘍が免疫細胞から身を隠す「コールド」な状態にあることです。研究チームはAIに対し、「低レベルの免疫信号(インターフェロン)が存在する環境下でのみ、免疫反応を増幅する薬剤」という非常に高度な条件を付けて探索させました。これは、腫瘍を特異的に「ホット」な状態に変えるための重要な戦略です。

AIは4,000種類以上の既存薬データを仮想スクリーニングし、キナーゼCK2阻害剤「silmitasertib」が上記の条件を満たすと予測しました。驚くべきことに、この薬剤が免疫反応を高めるという事実はこれまで文献で報告されておらず、AIが単なる既知の事実の再現ではなく、全く新しい科学的仮説を生成したことを意味します。

このAIの予測を検証するため、研究チームは実験室でヒトの細胞を用いてテストを実施しました。その結果、silmitasertibと低用量のインターフェロンを組み合わせることで、免疫システムが腫瘍を認識する目印となる「抗原提示」が約50%も増加することが確認されました。AIの予測は見事に証明されたのです。

今回の成果は、AIが創薬研究において、有望な仮説を高速に生成し、実験の方向性を示す強力なツールとなり得ることを示しました。GoogleはC2S-Scale 27Bモデルを研究コミュニティに公開しており、今後、この技術を応用した新しい併用療法の開発が世界中で加速することが期待されます。

ソブリンAI、米中技術覇権の新たな主戦場に

米国のソブリンAI戦略

OpenAIが各国政府と提携
国家によるAI統制を支援
非民主主義国との連携に懸念も

中国のオープンソース攻勢

Alibabaのモデルは3億DL超
来年には米国を凌駕する可能性

真のAI主権をめぐる論点

主権にはオープンソースが必須との声
クローズドとオープンの両立も可能

OpenAIをはじめとするテクノロジー企業が、「ソブリンAI」の構築支援を各国で進めています。ソブリンAIとは、各国が自国の管理下でAIインフラを開発・運用する能力を指し、米中間の技術覇権争いの新たな主戦場となりつつあります。米国が同盟国との連携を深める一方、中国オープンソースモデルで世界的な影響力を急速に拡大しています。

OpenAIはアラブ首長国連邦(UAE)などの政府と提携し、大規模なデータセンター建設を含むソブリンAIシステム構築を支援しています。この動きは米国政府とも連携しており、同盟国が中国の技術に依存するのを防ぐという戦略的な狙いがあります。米国の技術を世界に普及させることで、地政学的な優位性を確保しようとしています。

しかし、UAEのような非民主主義国との提携には懸念の声も上がっています。かつて米国は、経済的な関与が中国の民主化を促すと期待しましたが、結果的に権威主義体制を強めることになりました。AI技術の提供が同様の結果を招かないか、過去の教訓が問い直されています。OpenAIは政府からの要請があっても情報検閲は行わないと明言しています。

対する中国は、オープンソース戦略で猛追しています。AlibabaやTencent、DeepSeekといった企業が公開した高性能な基盤モデルは、世界中で広く採用されています。特にAlibabaの「Qwen」ファミリーは3億回以上ダウンロードされ、日本を含む各国のスタートアップが自国語対応モデルの開発基盤として活用しています。

オープンソースAIモデルをホストするHugging FaceのCEOは、「真の主権はオープンソースなしにはあり得ない」と指摘します。モデルの内部を完全に検証・制御できるためです。中国企業はこの戦略により驚異的な速さで技術力を向上させ、5年前の遅れを取り戻し、今や米国と互角のレベルに達したと分析されています。

AIの国家主権をめぐる競争は、クローズドモデルを推進する米国勢と、オープンソースで勢力を拡大する中国勢という構図を呈しています。OpenAIは両アプローチの共存が可能との見方を示していますが、どちらが次世代のグローバルスタンダードを握るのか。この動向は、各国の事業戦略を左右する重要な要素となるでしょう。

Salesforce、規制業界向けにAI『Claude』を本格導入

提携で実現する3つの柱

AgentforceでClaude優先モデル
金融など業界特化AIを共同開発
SlackClaude統合を深化

安全なAI利用と生産性向上

Salesforce信頼境界内で完結
機密データを外部に出さず保護
Salesforce開発にClaude活用
Anthropic業務にSlack活用

AI企業のAnthropicと顧客管理(CRM)大手のSalesforceは2025年10月14日、パートナーシップの拡大を発表しました。SalesforceのAIプラットフォーム『Agentforce』において、AnthropicのAIモデル『Claude』を優先的に提供します。これにより、金融や医療など規制が厳しい業界の顧客が、機密データを安全に保ちながら、信頼性の高いAIを活用できる環境を整備します。提携は業界特化ソリューションの開発やSlackとの統合深化も含まれます。

今回の提携の核心は、規制産業が抱える「AIを活用したいが、データセキュリティが懸念」というジレンマを解消する点にあります。Claudeの処理はすべてSalesforceの仮想プライベートクラウドで完結。これにより、顧客はSalesforceが保証する高い信頼性とセキュリティの下で、生成AIの恩恵を最大限に享受できるようになります。

具体的な取り組みの第一弾として、ClaudeSalesforceのAgentforceプラットフォームで優先基盤モデルとなります。Amazon Bedrock経由で提供され、金融、医療、サイバーセキュリティなどの業界で活用が見込まれます。米RBC Wealth Managementなどの企業は既に導入し、アドバイザーの会議準備時間を大幅に削減するなど、具体的な成果を上げています。

さらに両社は、金融サービスを皮切りに業界に特化したAIソリューションを共同開発します。また、ビジネスチャットツールSlackClaudeの連携も深化。Slack上の会話やファイルから文脈を理解し、CRMデータと連携して意思決定を支援するなど、日常業務へのAI浸透を加速させる計画です。

パートナーシップは製品連携に留まりません。Salesforceは自社のエンジニア組織に『Claude Code』を導入し、開発者生産性向上を図ります。一方、Anthropicも社内業務でSlackを全面的に活用。両社が互いの製品を深く利用することで、より実践的なソリューション開発を目指すとしています。

AIエージェント更新、効果をA/Bテストで可視化

Raindropの新機能

企業向けAIエージェントA/Bテスト
更新による性能変化を正確に比較
実ユーザー環境での振る舞いをデータで追跡

開発の課題を解決

「評価は合格、本番で失敗」問題に対処
データ駆動でのモデル改善を支援
障害の根本原因を迅速に特定

提供形態と安全性

月額350ドルのProプランで提供
SOC 2準拠で高い安全性を確保

AIの可観測性プラットフォームを提供するスタートアップRaindropが、企業向けAIエージェントの性能を評価する新機能「Experiments」を発表しました。LLMの進化が加速する中、モデル更新が性能に与える影響をA/Bテストで正確に比較・検証できます。これにより、企業はデータに基づいた意思決定でAIエージェントを継続的に改善し、実際のユーザー環境での「評価は合格、本番で失敗する」という根深い問題を解決することを目指します。

「Experiments」は、AIエージェントへの変更がパフォーマンスにどう影響するかを可視化するツールです。例えば、基盤モデルの更新、プロンプトの修正、使用ツールの変更など、あらゆる変更の影響を追跡。数百万件もの実ユーザーとの対話データを基に、タスク失敗率や問題発生率などをベースラインと比較し、改善か改悪かを明確に示します。

多くの開発チームは「オフライン評価は合格するのに、本番環境ではエージェントが失敗する」というジレンマに直面しています。従来の評価手法では、予測不能なユーザーの行動や長時間にわたる複雑なツール連携を捉えきれません。Raindropの共同創業者は、この現実とのギャップを埋めることが新機能の重要な目的だと語ります。

このツールは、AI開発に現代的なソフトウェア開発の厳密さをもたらします。ダッシュボードで実験結果が視覚的に表示され、どの変更が肯定的な結果(応答の完全性向上など)や否定的な結果(タスク失敗の増加など)に繋がったかを一目で把握可能。これにより、チームは憶測ではなく客観的データに基づいてAIの改善サイクルを回せます。

Raindropは元々、AIの「ブラックボックス問題」に取り組む企業として設立されました。従来のソフトウェアと異なりAIは「静かに失敗する」特性があります。同社は、ユーザーフィードバックやタスク失敗などの兆候を分析し本番環境での障害を検知することから事業を開始。今回の新機能は、障害検知から一歩進んで改善効果の測定へと事業を拡張するものです。

「Experiments」は、Statsigのような既存のフィーチャーフラグ管理プラットフォームとシームレスに連携できます。セキュリティ面では、SOC 2に準拠し、AIを用いて個人を特定できる情報(PII)を自動で除去する機能も提供。企業が機密データを保護しながら、安心して利用できる環境を整えています。本機能は月額350ドルのProプランに含まれます。

Samsungの超小型AI「TRM」、再帰で巨大LLMを超える

TRMのパラメーターと仕組み

パラメーター数はわずか700万
既存LLMの1万分の1サイズ
再帰的推論による予測の洗練
低コストで高性能モデルを実現

性能と適用領域

数独や迷路など構造化パズルに特化
特定ベンチマーク巨大LLMを凌駕
設計の簡素化が汎化性能向上に寄与
コードはMITライセンスで公開中

韓国Samsung AI研究所の研究者が、新たな超小型AIモデル「TRM(Tiny Recursion Model)」を発表しました。わずか700万パラメーターのこのモデルは、特定の推論ベンチマークにおいて、OpenAIのo3-miniやGoogleGemini 2.5 Proなど、1万倍以上巨大なLLMの性能を凌駕しています。AI開発における「スケールこそ全て」という従来のパラダイムに対し、低コストで高性能を実現する新たな道筋を示す画期的な成果です。

TRMの最大の特徴は、階層構造を持つ複雑なネットワークを排除し、単一の2層モデルを採用した点です。このモデルは、入力された質問と初期回答に対し、推論ステップを繰り返して自身の予測を再帰的に洗練させます。この反復的な自己修正プロセスにより、深いアーキテクチャをシミュレートし、巨大モデルに匹敵する推論能力を獲得しています。

TRMは、構造化され、視覚的なグリッドベースの問題に特化して設計されました。特にSudoku-Extremeで87.4%の精度を達成し、従来モデル(HRM)の55%から大幅に向上。また、人間の推論は容易だがAIには難解とされるARC-AGIベンチマークでも、数百万倍のパラメーターを持つ最上位LLMに匹敵する結果を出しています。

開発者は、高額なGPU投資電力消費を伴う巨大な基盤モデルへの依存は「罠」だと指摘します。TRMの成功は、複雑性を減らすことで逆に汎化性能が向上するという「Less is More(少ない方が豊か)」の設計思想を裏付けました。この成果は、大規模な計算資源を持たない企業や研究者でも、高性能AIを開発できる可能性を示唆します。

TRMのコードは、商用利用も可能なMITライセンスのもとGitHubでオープンソース公開されています。これにより、企業は特定の推論タスク解決のために、巨大LLMのAPIを利用するのではなく、自社のサーバーで低コストの専用モデルを構築・運用できます。今後は、再帰的推論スケーリング則や、生成タスクへの応用が焦点となる見込みです。

MITとMBZUAIが5年協定、AI基盤強化と地球課題解決へ

連携の核心

AIの基盤強化と応用促進
期間は5年間の国際共同研究

共同研究の重点領域

科学的発見の加速
人間の繁栄への貢献
地球の健康(持続可能性)

プログラム運営体制

研究資金はMBZUAIが支援
両大学から共同責任者を任命
研究成果はオープン公開を原則

マサチューセッツ工科大学(MIT)のシュワルツマン・コンピューティング・カレッジは、ムハンマド・ビン・ザーイド人工知能大学(MBZUAI、アラブ首長国連邦)との5年間にわたる共同研究プログラムを正式に開始しました。この連携は、AIの技術的基盤を強化するとともに、喫緊の科学的・社会的課題への応用を加速させることを目的としています。国際的なトップレベルの頭脳が結集し、次世代AIの方向性を定める動きとして注目されます。

本プログラムでは、教員や研究者、学生が連携し、主に三つの核となる領域で基礎研究を推進します。それは「科学的発見の加速」「人間の繁栄への貢献」、そして「地球の健康(環境問題や持続可能性)」です。MIT側は「AIが責任ある、包括的かつ世界的に影響力のある形で進化する」という共通のコミットメントを強調しています。

MBZUAIのエリック・シン学長は、この提携が「トランスコンチネンタル(大陸横断的)な発見の橋」を築くと述べています。AI専用の大学であるMBZUAIが持つ基盤モデル実世界への展開力と、MITが誇る計算科学と学際的なイノベーションの深さを融合させます。これにより、ブレークスルーが人間の健康改善やインテリジェント・ロボティクスなどに直結することが期待されます。

このプログラムは、AI科学を通じた進歩を専門とするアブダビ拠点のMBZUAIからの資金支援を受けて運営されます。毎年多数の共同プロジェクトが資金提供を受け、両大学から選出された運営委員会が研究テーマを決定します。さらに重要な点として、研究成果は原則としてオープンに公開可能であり、広範な知識共有を促進する方針です。

AIエージェントの信頼性を劇的向上 AUIが「確実な行動」実現の独自モデル発表

現行AIエージェントの課題

タスク完了の信頼性が低い(企業レベル未達)
業界ベンチマークで成功率30〜56%に留まる
純粋な生成AIは「もっともらしいテキスト」を出力
特定の規則やポリシー遵守の「確実性」が欠如

信頼性を生む独自技術

基盤モデル「Apollo-1」を開発
ハイブリッドなニューロ・シンボリック推論を採用
言語能力と構造化された論理を融合
次トークン予測ではなく次アクション予測を実行

性能差が示す実力

TAU-Bench Airlineで92.5%の通過率を達成
既存トップモデルを大幅に上回る
AmazonGoogle Flightsでのタスク実行も高精度
企業ポリシー遵守をシステムプロンプトで保証

ステルススタートアップAugmented Intelligence(AUI)は、エンタープライズ向けAIエージェントの信頼性を劇的に高める基盤モデル「Apollo-1」を発表しました。従来のLLMが苦手としていた、タスクの確実な実行という課題を克服するため、独自開発のハイブリッドアーキテクチャを採用し、ベンチマークで圧倒的な性能差を示しています。

従来のLLMは、チャットや探索的な対話では優れた能力を発揮しますが、企業が求める複雑なタスクを確実に実行する能力が不足していました。AIエージェントの性能を測るベンチマーク「Terminal-Bench Hard」では、現在の最高モデルでも成功率は30%台に留まり、ビジネスルールが求められる場面で信頼性に欠ける点が大きな課題でした。

Apollo-1は「ステートフル・ニューロ・シンボリック推論」というハイブリッド構造に基づいています。これは言語の流暢さを担うニューラル層と、意図や制約といった構造化された論理を担うシンボリック層を統合し、タスク実行における「確実性(Certainty)」を保証するためのものです。

Transformerモデルが次のトークンを確率的に予測するのに対し、Apollo-1は会話の中で次に取るべき「アクション」を予測します。この構造により、エンコーダが自然言語をシンボリックな状態に変換し、決定エンジンが次の行動を決定するという、閉じた推論ループを実行。統計的な予測ではなく、決定論的な動作を実現しています。

この決定的な動作は、企業ポリシーの遵守において極めて重要です。例えば、銀行が「200ドル以上の返金には必ずID確認を義務付ける」といった制約を、Apollo-1では「System Prompt(振る舞い契約)」として定義し、確実に実行できます。これは、純粋な生成AIでは保証できない行動の信頼性を実現します。

ベンチマーク結果はその有効性を示しています。航空券予約タスクを評価する「TAU-Bench Airline」において、Apollo-1は92.5%という驚異的な通過率を達成。これは競合するトップモデルの56%を大きく引き離すものであり、金融、旅行、小売など、タスク実行の信頼性が求められる業界での応用が期待されます。

PowerSchool、SageMakerで実現した教育AI向けコンテンツフィルタリング

K-12教育特化AIの安全確保

K-12教育向けAIアシスタント「PowerBuddy」
歴史教育などでの誤検出(False Positive)を回避
いじめ・自傷行為の即時検知を両立させる必要性

SageMaker活用によるモデル育成

Llama 3.1 8BをLoRA技術で教育特化ファインチューニング
高い可用性とオートスケーリングを要件にSageMakerを採用
有害コンテンツ識別精度約93%、誤検出率3.75%未満

事業へのインパクトと将来性

学校現場での教師の負担を大幅に軽減
将来的にマルチアダプター推論で運用コストを最適化

教育分野向けのクラウドソフトウェア大手PowerSchoolは、AIアシスタント「PowerBuddy」の生徒安全を確保するため、AWSAmazon SageMaker AIを活用し、コンテンツフィルタリングシステムを構築しました。オープンな基盤モデルであるLlama 3.1を教育ドメインに特化してファインチューニングし、高い精度と極めて低い誤検出率を両立させ、安全な学習環境の提供を実現しています。

このソリューションが目指したのは「責任あるAI(Responsible AI)」の実現です。ジェネリックなAIフィルタリングでは、生徒が歴史的な戦争やホロコーストのような機微な学術的話題を議論する際に、誤って暴力的コンテンツとして遮断されるリスクがありました。同時に、いじめや自傷行為を示唆する真に有害な内容は瞬時に検知する必要があり、ドメイン特化の調整が不可欠でした。

PowerSchoolは、このカスタムモデルの開発・運用基盤としてAmazon SageMaker AIを選定しました。学生の利用パターンは学校時間帯に集中するため、急激なトラフィック変動に対応できるオートスケーリング機能と、ミッションクリティカルなサービスに求められる高い信頼性が決め手となりました。また、モデルの重みを完全に制御できる点も重要でした。

同社はLlama 3.1 8Bモデルに対し、LoRA(Low Rank Adaptation)技術を用いたファインチューニングをSageMaker上で行いました。その結果、教育コンテキストに特化した有害コンテンツ識別精度は約93%を達成。さらに、学術的な内容を誤って遮断する誤検出率(False Positive)を3.75%未満に抑えることに成功しました。

この特化型コンテンツフィルタリングの導入は、学生の安全を確保するだけでなく、教育現場に大きなメリットをもたらしています。教師はAIによる学習サポートにおいて生徒を常時監視する負担が減り、より個別指導に集中できるようになりました。現在、PowerBuddyの利用者は420万人以上の学生に拡大しています。

PowerSchoolは今後、SageMaker AIのマルチアダプター推論機能を活用し、コンテンツフィルターモデルの隣で、教育ドメインに特化した意思決定エージェントなど複数の小型言語モデル(SLM)を展開する計画です。これにより、個別のモデルデプロイが不要となり、専門性能を維持しつつ大幅なコスト最適化を目指します。

AI、創造性の共創者へ Disrupt 2025で未来を探る

TechCrunch Disrupt 2025

1万人超のリーダー集結
AI Stageで専門セッション
創造性とAIの交差点を議論

業界を革新する3人の先駆者

Pocket Entertainment: オーディオ物語
Wonder Dynamics: 3Dアニメーション

AIの新たな役割

データ処理から共創者
人間と機械の知性の融合
クリエイティブ領域を開拓

TechCrunchが主催する世界的なテックカンファレンス「Disrupt 2025」で、AIが創造的産業をどう変えるかを探るセッションが開催されます。Pocket Entertainment、Wonder Dynamics、TwelveLabsの創業者3名が登壇し、AIが人間の想像力と融合し、ストーリーテリングやメディア制作の「共創者」となる未来について議論します。1万人以上のリーダーや投資家が集う注目のイベントです。

AIはもはや、単なるデータ処理ツールではありません。人間の創造性を拡張し、物語の作り方や体験のデザイン、そして顧客との繋がり方を根本から変えるアクティブな協力者へと進化しています。このセッションでは、アーティストとアルゴリズムの境界線が曖昧になる中で、どのような新たなクリエイティブ領域が開拓されるのか、その最前線が示されます。

登壇者の一人、Pocket Entertainmentの共同創業者Prateek Dixit氏は、オーディオファーストのストーリーテリングの先駆者です。AI駆動のツールと人間の創造性を巧みに組み合わせ、物語を世界規模で展開する手法は、コンテンツ制作の新しいモデルとして注目されています。

Wonder Dynamicsの共同創業者Nikola Todorovic氏は、3Dキャラクターのアニメーション制作を劇的に容易にするAIソフトウェアを開発しました。彼の技術は、これまで時間とコストがかかっていたVFX作業を効率化し、クリエイターの表現の幅を大きく広げる可能性を秘めています。

TwelveLabsの共同創業者であるSoyoung Lee氏は、高度な動画基盤モデルで業界をリードしています。彼女の技術は、動画検索、理解、そして大規模な活用方法を再定義し、映像コンテンツが持つ価値を飛躍的に高めることに貢献しています。

今回のセッションは、創業者投資家、そしてクリエイティブな技術者にとって、人間の想像力と機械知能が融合する未来をいち早く知る絶好の機会となるでしょう。AIが切り拓く次世代のクリエイティブ産業の可能性とは何か。その答えを探る議論に、大きな期待が寄せられています。

AI動画は物理法則を理解したか?Google論文の検証

DeepMindの野心的な主張

Google Veo 3の能力を検証
ゼロショットでのタスク解決を主張
汎用的な視覚基盤モデルへの道筋

見えてきた性能の限界

一部タスクでは高い一貫性
ロボットの動作や画像処理で成功
全体としては一貫性に欠ける結果
「世界モデル」構築はまだ途上

Google DeepMindが、最新のAI動画モデル「Veo 3」が物理世界をどの程度理解できるかを探る研究論文を発表しました。論文では、Veo 3が訓練データにないタスクもこなす「世界モデル」への道を歩んでいると主張しますが、その結果は一貫性に欠け、真の物理世界のシミュレーション能力には依然として大きな課題があることを示唆しています。

研究者らは、Veo 3が明示的に学習していない多様なタスクを解決できる「ゼロショット学習者」であると主張します。これは、AIが未知の状況に対しても柔軟に対応できる能力を持つことを意味し、将来的に汎用的な視覚基盤モデルへと進化する可能性を示唆するものです。

確かに、一部のタスクでは目覚ましい成果を上げています。例えば、ロボットの手が瓶を開けたり、ボールを投げたり捕ったりする動作は、試行を通じて安定して説得力のある動画を生成できました。画像のノイズ除去や物体検出といった領域でも、ほぼ完璧に近い結果を示しています。

しかし、その評価には注意が必要です。外部の専門家は、研究者たちが現在のモデルの能力をやや楽観的に評価していると指摘します。多くのタスクにおいて結果は一貫性を欠いており、現在のAI動画モデルが、現実世界の複雑な物理法則を完全に理解していると結論付けるのは時期尚早と言えるでしょう。

経営者エンジニアにとって重要なのは、この技術の現状と限界を冷静に見極めることです。AI動画生成は強力なツールとなり得ますが、物理的な正確性が求められるシミュレーションロボット工学への応用には、まだ慎重な検証が必要です。

NVIDIA、ロボット学習を加速する物理エンジン公開

新物理エンジンNewton

Google、Disneyと共同開発
GPUで高速化されたシミュレーション
複雑な人型ロボットの学習を推進
Linux財団が管理するオープンソース

開発エコシステムの強化

基盤となるOpenUSDフレームワーク
新モデル「Isaac GR00T」も公開
主要ロボット企業が採用を開始
「シム・ファースト」開発の加速

NVIDIAは今週開催のロボット学習カンファレンスで、Google DeepMindやDisney Researchと共同開発した新しい物理エンジン「Newton」をオープンソースとして公開しました。人型ロボットなど複雑な動作が求められる物理AIの開発を、現実世界での実証前にシミュレーションで高速化・安全化させるのが狙いです。

Newtonは、NVIDIAGPU高速化技術「Warp」と3Dデータ標準「OpenUSD」を基盤に構築されています。従来の物理エンジンでは限界があった、人型ロボットの持つ多数の関節やバランス制御といった複雑な動きを、より正確かつ高速にシミュレーション上で学習させることが可能です。

ロボット開発では、実機での試行錯誤にかかる時間やコスト、危険性が課題でした。仮想空間で先に訓練を行う「シム・ファースト」のアプローチは、この課題を解決します。OpenUSDで構築された忠実なデジタルツイン環境が、ロボットのスキル獲得を飛躍的に効率化するのです。

この取り組みはNewton単体にとどまりません。ロボット向け基盤モデル「Isaac GR00T」や開発フレームワーク「Isaac Lab」もアップデートされ、包括的な開発エコシステムが強化されています。既にAgility Roboticsなど主要企業が採用しており、その実用性が示されています。

Linux財団が管理するオープンソースとして公開されたことで、Newtonは今後のロボット開発の新たな標準となる可能性があります。開発の参入障壁を下げ、工場や病院など多様な現場で人間と協働するロボットの実現を大きく前進させるでしょう。

PropHero、BedrockでAI投資顧問開発 業務効率化とコスト60%削減

不動産投資管理サービスのPropHero社が、AWSと協業し、生成AIサービス「Amazon Bedrock」を用いてインテリジェントな不動産投資アドバイザーを開発しました。このシステムは、顧客に合わせた投資戦略を自然言語で提案し、業務効率化と大幅なコスト削減を両立した事例として注目されます。 導入によるビジネスインパクトは顕著です。AIアドバイザーの投資目標達成率は90%に達し、有料ユーザーの70%以上が積極的に利用しています。また、一般的な問い合わせ対応を30%自動化し、スタッフはより複雑な業務に集中できるようになりました。戦略的なモデル選択により、AIコストも60%削減しています。 高い性能とコスト効率はどのように両立したのでしょうか。その鍵は、複数のAIエージェントが協調動作する「マルチエージェント・アーキテクチャ」にあります。各エージェントは、質問の分類、専門的な助言、最終応答の生成など、特定のタスクに特化しており、LangGraphというツールでその連携を制御しています。 同社は、タスクの複雑さに応じて最適な基盤モデル(FM)を選択する戦略を採用しました。例えば、簡単な応答には高速で安価な「Amazon Nova Lite」、専門的な投資助言には高性能な「Amazon Nova Pro」を割り当てることで、コストパフォーマンスを最大化しています。 高品質な応答を維持するため、継続的な評価システムを組み込んでいます。会話データから「文脈との関連性」や「回答の正確性」といった指標をリアルタイムで測定します。これにより、AIアドバイザーの品質を常に監視し、迅速な改善サイクルを回すことが可能になっています。 専門知識の提供には「Amazon Bedrock Knowledge Bases」を活用しています。FAQ形式のコンテンツに最適化されたセマンティックチャンキングや、Cohere社の多言語モデルを採用することで、スペイン語圏の利用者にも正確で文脈に沿った情報を提供できる体制を整えました。 開発の背景には、不動産投資における情報格差やプロセスの煩雑さという課題がありました。PropHero社はこれらの障壁を取り除くため、誰でも専門的な知見にアクセスできるAIシステムの開発を目指しました。特にスペインとオーストラリアの市場に合わせた対応が求められていました。 本事例は、生成AIが具体的なビジネス価値を生み出すことを明確に示しています。モジュール化されたアーキテクチャと堅牢な評価基盤を組み合わせることで、顧客エンゲージメントを継続的に向上させるソリューションを構築できるのです。

Amazon、出品者向けAIエージェント拡充 在庫管理から広告生成まで自動化

Agentic AI「Seller Assistant」進化

アカウント状態と在庫レベルを常時監視
売れ行き不振商品の価格変更や削除を推奨
需要パターンに基づき出荷を自動提案
新製品安全規制などコンプライアンスを自動チェック

AI広告チャットボットの導入

テキストプロンプト静止画・動画広告を生成
ブランドガイドラインを反映したクリエイティブの自動作成
タグライン、スクリプト、ボイスオーバーの生成
Amazon外のメディア(Prime Video等)への広告展開

Amazonは2025年9月、プラットフォーム上のサードパーティ出品者向けに、自律的に業務を代行するエージェントAI機能の導入・拡張を発表しました。既存の「Seller Assistant」を強化し、さらにAI広告作成チャットボットを提供します。これにより、在庫管理、コンプライアンス遵守、広告クリエイティブ制作などの広範な業務が自動化され、出品者の生産性と収益性の最大化を図ります。

拡張されたSeller Assistantは「常時稼働」のAIエージェントとして機能します。これは単なるツールではなく、セラーに代わってプロアクティブに働きかけることを目的としています。ルーティン業務から複雑なビジネス戦略までを自動で処理し、出品者は商品開発や事業成長といったコア業務に集中できる体制を構築します。

特に注目されるのが在庫管理の最適化機能です。エージェントは在庫レベルを継続的に監視し、売れ行きの遅い商品を自動的に特定します。これにより、長期保管料が発生する前に価格の引き下げや商品の削除を推奨。また、需要パターンを分析し、最適な出荷計画を立てるサポートも行います。

複雑化する規制への対応も自動化します。Seller Assistantは、出品リストが最新の製品安全性ポリシーに違反していないかをスキャンするほか、各国で販売する際のコンプライアンス要件への適合を自動で確保します。これはグローバル展開を志向するセラーにとって大きなリスク低減となります。

同時に導入されたAI広告チャットボットは、クリエイティブ制作の時間とコストを大幅に削減します。出品者が求める広告の概要をテキストで入力するだけで、AIがブランドガイドラインや商品詳細に基づき、静止画や動画のコンセプトを自動で生成します。

このチャットボットは、タグラインや画像だけでなく、スクリプト作成、音楽追加、ボイスオーバー、絵コンテのレイアウトまでを完結できます。生成された広告は、Amazonのマーケットプレイス内だけでなく、Prime VideoやKindle、TwitchといったAmazonの広範なプロパティに展開され、露出を最大化します。

これらの新機能は、Amazon独自の基盤モデルであるNova AI、およびAnthropicClaudeを活用しています。今回の発表は、AIが商取引を主体的に推進する「エージェント主導型コマース」の流れを加速させています。Googleなども同様にエージェントによる決済プロトコルを公開しており、AIによる業務代行競争が本格化しています。

QuoraのPoe、AWS BedrockでAIモデル統合を96倍高速化

開発生産性の劇的向上

デプロイ時間を96倍高速化(数日→15分)。
必須コード変更を95%削減
テスト時間を87%短縮。
開発リソースを機能開発へ集中

統一アクセスレイヤーの構築

異なるAPI間のプロトコル変換を実現。
設定駆動型による迅速なモデル追加。
認証(JWTとSigV4)のブリッジング機能

マルチモデル戦略の強化

30以上のテキスト/画像モデル統合。
設定変更でモデル能力を拡張可能に。

QuoraのAIプラットフォーム「Poe」は、Amazon Web Services(AWS)と協業し、基盤モデル(FM)のデプロイ効率を劇的に改善しました。統一ラッパーAPIフレームワークを導入した結果、新規モデルのデプロイ時間が数日からわずか15分に短縮され、その速度は従来の96倍に達しています。この成功事例は、複数のAIモデルを大規模に運用する際のボトルネック解消法を示しています。

Poeは多様なAIモデルへのアクセスを提供していますが、以前はBedrock経由の各モデルを統合するたびに、独自のAPIやプロトコルに対応する必要がありました。Poeはイベント駆動型(SSE)、BedrockはRESTベースであり、この違いが膨大なエンジニアリングリソースを消費し、新しいモデルの迅速な提供が課題となっていました。

AWSのGenerative AI Innovation Centerとの連携により、PoeとBedrockの間に「統一ラッパーAPIフレームワーク」を構築しました。この抽象化レイヤーが、異なる通信プロトコルのギャップを埋め認証や応答フォーマットの違いを吸収します。これにより、「一度構築すれば、複数のモデルを展開可能」な体制が確立されました。

この戦略の結果、新規モデルを統合する際の必須コード変更量は最大95%削減されました。エンジニアの作業内容は、以前の65%がAPI統合だったのに対し、導入後は60%が新機能開発に集中できるようになりました。この生産性向上により、Poeはテキスト、画像動画を含む30以上のBedrockモデルを短期間で統合しています。

高速デプロイの鍵は、「設定駆動型アーキテクチャ」です。新しいモデルの追加には統合コードの記述は不要で、設定ファイルへの入力のみで完結します。さらに、Bedrockが導入した統一インターフェース「Converse API」を柔軟に活用することで、チャット履歴管理やパラメーター正規化が容易になり、統合作業がさらに簡素化されました。

本フレームワークは、マルチモーダル機能の拡張にも貢献しています。例えば、本来テキスト専用のモデルに対しても、Poe側が画像を分析しテキスト化することで、擬似的な画像理解能力を付与できます。これにより、基盤モデルのネイティブな能力によらず、一貫性のあるユーザーエクスペリエンスを提供可能になりました。

本事例は、AIモデル活用の競争優位性を得るには、個別のモデル連携に時間を使うのではなく、柔軟な統合フレームワークへの初期投資が極めて重要であることを示唆しています。抽象化、設定駆動、堅牢なエラー処理といったベストプラクティスは、AIを大規模展開し、市場価値を高めたい組織にとって必須の戦略となるでしょう。

NVIDIAが英国の「AIメーカー」戦略を加速 物理AI・創薬・ロボティクス分野で広範に連携

英国の国家AI戦略を支援

英国のAI機会行動計画を後押し
世界クラスの計算基盤への投資
AI採用を全経済分野で推進
AIユーザーでなくAIメーカーを目指す

重点分野での協業事例

スパコンIsambard-AI」で基盤構築
ロボティクス:自律走行、製造、ヒューマノイド開発
ライフサイエンス:AI創薬デジタルツインを活用

NVIDIA英国のAIエコシステムとの広範なパートナーシップを強調し、英国の国家戦略である「AIメーカー」としての地位確立を強力に支援しています。ジェンスン・ファンCEOの英国訪問に際し、物理AI、ロボティクス、ライフサイエンス、エージェントAIなど最先端領域における具体的な協業事例が公表されました。

英国のAI基盤強化の核となるのは、NVIDIA Grace Hopper Superchipsを搭載した国内最速のAIスーパーコンピューター「Isambard-AI」です。これにより、公的サービスの改善を目指す独自の多言語LLM(UK-LLM)や、早期診断・個別化医療に向けた医療基盤モデル(Nightingale AI)など、重要な国家プロジェクトが推進されています。

特に物理AIとロボティクス分野での応用が加速しています。Extend Roboticsは製造業向けに安全なロボット遠隔操作システムを開発。Humanoid社は倉庫や小売店向けの汎用ヒューマノイドロボットを開発しており、いずれもNVIDIAのJetsonやIsaacプラットフォームが活用されています。

ライフサイエンス分野では、AIによる創薬の加速が目覚ましいです。Isomorphic LabsはAI創薬エンジンを構築し、英国CEiRSIはNVIDIA技術を用いて複雑な患者のデジタルツインを作成。これにより、大規模かつ多様な患者集団に対する新しい治療法のテストを可能にしています。

エージェントAIおよび生成AIのイノベーションも活発です。Aveniは金融サービスに特化したLLMを開発し、コンプライアンスを確保しながら顧客対応やリスク助言を行うエージェントフレームワークを構築しました。ElevenLabsやPolyAIは、超リアルな音声生成や、大規模な顧客サポート自動化を実現しています。

また、AIスキルギャップ解消への取り組みも重要です。技術ソリューションプロバイダーのSCANは、NVIDIA Deep Learning Instituteと連携し、コミュニティ主導型のトレーニングプログラムを展開しています。これにより、英国全土でAIや専門的なワークロードに対応できる人材育成が進められています。

Google、生成AI「LearnLM」で学習効果11%向上へ

学習効果を高めるAI基盤

独自AIモデル「LearnLM」を活用
教育学に基づきコンテンツを再構築
最新のGemini 2.5 Proに統合
静的な教科書を対話型ガイドに変換

個々人に合わせた学習体験

学習者のレベルや興味に応じて内容を適応
インドマップや音声レッスンを生成
リアルタイムフィードバック付きの対話型クイズ
長期記憶テストで11%のスコア向上

Googleは、教育分野における生成AI活用実験「Learn Your Way」を発表しました。独自AIモデル「LearnLM」を基盤とし、静的な教科書を学習者の興味やレベルに合わせた対話型コンテンツに変革します。学習科学に基づいて設計されたこのツールは、従来のデジタル教材利用者と比較して長期記憶テストで11%のスコア向上を実現しました。

Learn Your Wayの中核となるのは、教育学(ペダゴジー)が注入された特化型モデルLearnLMです。これは現在、Googleの高性能基盤モデルGemini 2.5 Proに直接統合されています。単なる情報検索ではなく、学習プロセス全体にAIを深く関与させ、指導のエッセンスを組み込むことが特徴です。

具体的な機能として、AIは元の教材に基づき、マインドマップ、オーディオレッスン、そしてリアルタイムフィードバック付きのインタラクティブなクイズなどを生成します。これにより、学習者が自身のペースやスタイルで能動的に学びを進められる、自己主導的な学習環境を提供します。

この実証実験で示された11パーセントポイントという記憶定着率の向上は、企業研修や高度な専門知識の習得において、極めて重要な意味を持ちます。生産性向上を目指す経営層やリーダーにとって、特化型AIが教育・トレーニングにもたらす革新性を示す明確な事例として注目されます。

DeepMind、年間1.4兆エンベディングで地球をデータ化するAI公開

地球動態把握AIの核心

衛星データなどから地球を統一デジタル表現
10m四方のセルごとに64次元のエンベディング生成
年間1.4兆超の緻密なデータ要約

技術的優位性と応用範囲

従来のストレージ要件を16分の1に大幅削減
競合比でエラー率23.9%減を達成
ラベルデータが少ない状況でも高精度な分類を実現
都市計画や山火事リスク管理など広範に適用

Google DeepMindは、地球の広範な変化を高精度に追跡するAIモデル「AlphaEarth Foundations」を発表しました。このモデルは地球を「生きたデータセット」として捉え、衛星画像やセンサーデータなど多様な情報を統合します。年間1.4兆を超えるエンベディングを生成し、従来困難だった地球規模のデジタル表現と分析を革新します。

AlphaEarthの核心技術は、地球上の10m四方のセルごとに64次元の「エンベディング(数値要約)」を作成する点です。これにより、膨大な地理空間データを統一的に扱えるようになりました。この緻密なアプローチにより、ストレージ要件を従来の16分の1にまで削減しつつ、高い空間的・時間的な詳細度を維持しています。

地球観測における長年の課題であった、衛星データの不規則性や雲による欠損を本モデルは克服しています。光学画像だけでなく、レーダー、気候モデル、さらには地理タグ付きのWikipedia情報まで組み込むことで、マルチソース・マルチレゾリューションな一貫性のあるデータセットを構築しています。

ベンチマークテストの結果、AlphaEarthは競合する既存のアプローチと比較して、平均で23.9%低いエラー率を記録しました。また、ラベルデータが非常に少ない状況下でも高精度な分類を可能にし、通常数千のラベルを必要とするタスクで、少数のサンプルで87種の農作物や土地被覆タイプを特定できています。

この技術は、都市計画やインフラ管理、生態系追跡といった幅広い分野で即戦力となります。特にビジネス領域では、保険会社や通信会社などが空間分析プラットフォームCARTOを経由して利用を開始しています。

これにより、APIや追加ストレージなしで山火事リスクの高い地域を特定するなど、迅速なリスクモデル構築が可能になります。自社の既存ワークフローにエンベディングをロードするだけで、高度な環境プロファイリングが可能になる点がメリットです。

AlphaEarthは、パターンを学習しコンパクトに要約する自己教師あり学習フレームワークであり、生成モデルではありません。非営利利用向けにGoogle Earth Engineデータカタログを通じて無償提供されており、国連食糧農業機関(FAO)を含む世界50以上の組織が既に活用を進めています。

AIブームが巨大企業を置き去りにする可能性

基盤モデルの価値変化

基盤モデルコモディティ化
事前学習の効果が鈍化
事後学習強化学習へ注目が移行

競争環境の変化

アプリケーション層での競争が激化
オープンソース代替案の台頭
低マージン事業への転落リスク

企業戦略の再構築

ファインチューニングUI設計が重要
基盤モデル企業の優位性は縮小
新たな競争優位性の模索が必要

AIブームが進む中、基盤モデルを開発する巨大企業が置き去りにされる可能性が浮上している。かつては「GPTラッパー」と軽視されたAIスタートアップが、特定タスク向けのモデルカスタマイズやインターフェース設計に注力し始めたからだ。

基盤モデルの価値が変化している背景には、事前学習のスケーリング効果が鈍化している事実がある。AIの進歩は止まっていないが、超大規模モデルの初期利益は減少し、事後学習強化学習が新たな進化の源泉となっている。

競争環境も変化している。スタートアップGPT-5ClaudeGeminiなど基盤モデルを互換性のある部品として扱い、ユーザーが気づかない間にモデルを切り替えることを前提に設計している。

この状況は、OpenAIAnthropicのような基盤モデル企業を低マージンのコモディティ事業のバックエンドサプライヤーに変えるリスクをはらんでいる。ある創業者はこれを「スターバックスにコーヒー豆を売るようなもの」と表現した。

もちろん、基盤モデル企業が完全に脱落するわけではない。ブランド力、インフラ、巨額の資金など持続的な優位性も存在する。しかし、昨年までの「より大きな基盤モデルを構築する」という戦略は魅力を失いつつある。

AI開発の速いペースを考えると、現在の事後学習への注目も半年後には逆転する可能性がある。最も不確実なのは、汎用人工知能への競争が医薬品や材料科学で新たなブレークスルーを生み出す可能性だ。

結局のところ、AIの価値は基盤モデル自体ではなく、それを活用するアプリケーションやユーザー体験に移行しつつある。企業はこの変化に適応し、新たな競争優位性を築く必要に迫られている。