Arm(企業)に関するニュース一覧

AWSがロボット制御をエージェントに統合するSDK公開

SDKの中身

AWS製オープンソースSDK
LeRobot機能をAgentTool化
Apache2.0ライセンス
記録・学習・推論を一括統合

実機への展開

引数1つでシミュから実機へ
同一データ形式を共有
Zenoh活用の群制御
人間承認で安全担保

AWSは6月17日、ロボット開発の各工程を一つのAIエージェントから自然言語で操作できるオープンソースSDK「Strands Robots」を公開しました。Hugging Faceロボット学習基盤LeRobotの機能をエージェント用ツールとして束ね、これまで記録・学習・シミュレーション・実機展開・複数台連携の5つに分かれていた作業を一本化します。ライセンスはApache2.0です。

最大の特徴は、シミュレーションと実機のコードがほぼ同一である点です。ロボットを生成する関数は標準でMuJoCoベースの仮想環境を返し、引数をmode="real"に変えるだけで物理ロボットに切り替わります。仮想環境で記録したデータも実機の記録も同じLeRobotDataset形式で保存されるため、片方向けに書いた学習スクリプトをもう片方でもそのまま使えます。

ポリシー推論も共通の入口で扱えます。NVIDIAGR00Tやローカル推論、MolmoAct2のチェックポイントを同じインターフェースで呼び出せるほか、ACTやSmolVLA、π0なども利用可能です。GPUやDocker、Hugging Face認証情報がなくても、模擬ポリシーを使えばノートパソコン上でシミュレーションを最後まで動かせる設計です。

複数台の連携には、ブローカー不要のP2PプロトコルZenohを使ったメッシュ機能を採用しました。新しいロボットは起動した瞬間にメッシュへ参加し、エージェントが一斉に指示を出せます。IPアドレスの管理や探索コードの記述は不要です。

物理的に動作する命令には人間の承認を介在させる仕組みが標準で入っています。一斉送信や緊急停止などはLLMの引数とは別経路で操作者の許可を求めるため、プロンプトインジェクションで承認を偽装する攻撃を防げます。本番運用ではmTLS認証が必須とされ、信頼できないデータを与えない設計が推奨されています。

この統合の狙いは、LeRobotが持つ資産を作り直さず、エージェントから扱える表層だけを足すことにあります。Hub上のあらゆるデータセットがエージェントの拡張・学習・展開の対象になり、仮想と実機の境界は設計上の分断ではなく単なる展開手順の違いになります。AWSArmと協力した本番向けネットワーク層「Device Connect」も用意しており、コードを変えずに規模を広げられるとしています。

AI業界で小型モデルへの移行圧力が本格化

コスト圧力と業界の転換

推論コスト上昇で小型モデル再評価
80%の業務が安価モデルに移行との予測
大手ラボの収益構造に打撃の可能性

品質維持と実証事例

法律AI企業がコスト3分の1に削減
大小モデル併用で品質と効率を両立
真の対立軸は大型対小型モデル
スケーリング至上主義への転換点

AI業界では長らく「大きなモデルほど高性能で、最も高性能なモデルが勝つ」という前提が支配的でした。しかし推論コストの上昇と投資家による価格補助の縮小により、企業が初めて本格的なコスト圧力に直面しています。TechCrunchの報道によれば、より安価な小型モデルへの移行が業界全体で加速する兆候が見え始めています。

Coinbase共同創業者Brian Armstrong氏は、12〜18カ月以内に80%のワークロードが99%安価なモデルで処理されるようになると予測しています。高い知能が求められるのは残り20%の業務のみで、大半のタスクは小型モデルで十分対応できるという見方です。この予測が現実となれば、AI業界の経済構造に大きな変革をもたらします。

実際に法律AIスタートアップHarveyは、推論プラットフォームFireworks AIとの共同テストで、Claude Opusと小型モデルを組み合わせることで品質を維持しながら推論コストを3分の1に削減しました。同社共同創業者のGabe Pereyra氏は「品質が最優先だが、その定義はすべてに最強モデルを使うことから、最も効率的に正解を出すモデルを選ぶことへと進化している」と述べています。

注目すべきは、この動向がプロプライエタリ対オープンモデルという構図ではなく、大型モデル対小型モデルという本質的な対立軸にあることです。GPT-5.5からDeepSeek V4 Flashへの切り替えも、GPT-5.4-miniへの切り替えも同様の効果があり、モデルの出自よりもサイズとコストが判断基準になっています。

この変化は、OpenAIAnthropicIPOを控えるなか、大手ラボの収益に直接影響を及ぼす可能性があります。これまでのスケーリング重視のアプローチが見直され、推論需要の伸びが抑制されれば、巨額のフロンティアモデル訓練コストをどう正当化するかという新たな問いが浮上します。

NvidiaのAI半導体RTX Spark、Windows PCに登場

発表概要

Computex 2026で正式発表
Blackwell GB10超半導体を搭載
Microsoftが2機種を投入
Asus・Dell等大手OEMも参入

性能と強み

GPURTX 5070級と推定
Copilot+認証のNPU内蔵
鍵は成熟したソフト基盤

残る課題

ArmWindowsの定着が焦点
汎用PCとしての完成度

Nvidiaは2026年6月6日、台北で開催された見本市Computex 2026で、Windows PC向けの新半導体RTX Spark」を正式発表しました。同社のBlackwell GB10「スーパーチップ」をPC用に展開するもので、Microsoftは搭載機としてSurface Laptop UltraとSurface RTX Spark Dev Boxの2機種を公開。Asus、Dell、Lenovo、HP、MSIといった大手メーカーも対応PCを相次いで発表しました。

RTX Sparkの中核は、2025年末に登場したミニワークステーション「DGX Spark」と同系の設計です。コードネームN1Xと呼ばれるこの半導体は、20基のArm CPUコア、6,144基のGPUコア、最大128ギガバイトのLPDDR5Xメモリーを統合したシステムオンチップとなっています。ノートPC版は消費電力を抑える分、性能はメーカーごとの実装に左右される見込みです。

AI処理が注目を集めていますが、用途はそれだけではありません。RTX SparkはMicrosoftCopilot+認証に必要なNPUも内蔵し、Windows Recallなどの背景機能に活用されます。一方で大規模言語モデルや画像生成といった本格的なAI処理はGPUが担い、クリエイターやゲーマーからも期待が寄せられています。

Nvidiaの最大の強みは、ハードの性能よりむしろソフトウェアにあると専門家は指摘します。同社のGPUはゲームやプロ用途で事実上の業界標準であり、市場シェアは90%超とされます。第三者評価会社Signal65のRyan Shrout氏は「Nvidiaには、QualcommMicrosoftが初期に実現できなかったことを動かすだけの業界での重みがある」と語ります。

Microsoftは、AIエージェントを隔離環境で自律実行させる開発者向けSDK「Microsoft Execution Containers」の早期プレビューも公開しました。ただ課題は、QualcommMicrosoftが直面したものと同じです。IntelやAMDのx86チップに対し、ArmWindowsを有力な選択肢として定着させられるか。Shrout氏は「まず優れた汎用PCであることが大前提だと誰もが理解している」と述べ、真価が問われるのはこれからだと指摘しました。

NvidiaがRTX Sparkで本格AI PCに参入、統合メモリ最大128GB

RTX Sparkの技術的優位

統合メモリ最大128GB搭載
ArmN1 CPURTX GPU統合
CUDA基盤のAI処理をローカルで実現
RTX 5070相当のグラフィックス性能

市場への影響

MacBook Pro唯一の本格対抗馬
HP・Dell・Lenovo等が採用予定
Surface Laptop Ultraが旗艦モデルに
高性能構成は4,000ドル超の見込み

Nvidiaは2026年6月、台湾Computexで新チップRTX Sparkを発表しました。Arm系の独自CPU「N1」にRTXグラフィックスと最大128GBの統合メモリを組み合わせたSoCで、HP・Asus・Dell・Lenovoなど主要PCメーカーが搭載ノートPCを投入します。Nvidiaがデスクトップ向けGPUに留まらず、ノートPC全体のアーキテクチャを自ら設計する初の試みです。

これまでMicrosoftが推進してきた「AI PC」構想は、NPU搭載やメモリ16GB以上といった要件にとどまり、大規模言語モデルのローカル推論には力不足でした。RTX Sparkはデータセンターで実績のあるCUDAエコシステムをそのままノートPCに持ち込むことで、ローカルAI推論の性能を大幅に引き上げる狙いがあります。従来、この用途で唯一の選択肢だったMacBook Proに対し、Windows陣営から初めて本格的な対抗馬が登場したことになります。

Microsoftも自社製品Surface Laptop UltraをRTX Spark搭載の旗艦として投入します。15インチMini-LEDディスプレイを備え、MacBook Proと同等のフォームファクターを目指す製品です。高性能構成は4,000ドル超と予想されますが、同等スペックのMacBook Proと同水準の価格帯です。低価格構成ではゲーマーやクリエイター向けにも訴求する計画です。

ローカルAI推論のニーズは急速に高まっています。プライバシーの観点からエージェント型AIをローカルで動かす需要が増加し、Apple Mac Miniの出荷遅延が報告されるほどです。RTX SparkはノートPCだけでなく小型デスクトップにも展開予定で、Intel・AMD・Qualcommへの影響も注目されます。Windows PCに統合メモリとCUDAという新しいハードウェア層が加わることで、AI PCの定義そのものが書き換わる可能性があります。

Perplexity AIがローカルとクラウドを自動振り分ける推論基盤を発表

ハイブリッド推論の仕組み

タスク単位で実行場所を自動判定
機密データは端末内で処理
フロンティアモデルは複雑な推論に活用
Intel Core Ultra Series 3で実演

エンタープライズ戦略の深化

規制業界のデータガバナンスに対応
SOC 2 Type II取得済み環境と連携
時価総額200億ドル、売上目標6.56億ドル

競合環境と課題

AppleGoogle・MSも類似技術を開発中
9件の著作権訴訟が事業リスク

Perplexity AIは2026年6月2日、台湾で開催中のComputex 2026において、AIワークロードをローカル端末とクラウドの間で自動的に振り分ける「ハイブリッドローカル・サーバー推論オーケストレーター」を発表しました。CEOのAravind Srinivas氏がIntel CEOのLip-Bu Tan氏と共にステージ上でデモを実施し、機密性の高い資料の処理においてローカルモデルとクラウドモデルを動的に使い分ける仕組みを披露しました。同社の時価総額は200億ドルに達しています。

この技術の核心は、ユーザーが事前に実行場所を選ぶ必要がない点にあります。システムがタスクごとにデータの機密性と処理の複雑さを評価し、財務記録や健康情報などの機密データはローカル端末に留め、高度な推論が必要な処理はクラウド上のフロンティアモデルに送信します。クラウドへの送信前にはユーザーの許可を求める設計で、エンタープライズが懸念するデータガバナンスの問題に直接対応しています。

発表のタイミングは戦略的です。NvidiaArmベースのRTX Sparkスーパーチップを発表し、Intelも18A技術のXeon 6+やCore Ultra Series 3を披露した直後でした。ローカル端末の処理能力が向上するほどクラウド依存が減り、レイテンシとコストが改善されるため、Perplexityのオーケストレーターは半導体メーカーの戦略とも合致します。同社はチップ非依存の設計を掲げており、今後複数ベンダーへの最適化を進める方針です。

エンタープライズ向けには、金融・医療・法務など規制の厳しい業界での活用が想定されています。たとえば投資銀行が機密の案件資料を処理する際、機密部分はローカルで解析し、分析タスクのみクラウドに委ねるといった運用が可能になります。3月のAsk 2026カンファレンスで発表されたComputer for Enterpriseと組み合わせ、SnowflakeSalesforce・SharePointなど100以上のSaaS連携も提供しています。

一方で課題も山積しています。CNN・ニューヨーク・タイムズ・読売新聞など9組織からの著作権訴訟を抱えており、企業導入の判断に影響を与える可能性があります。また、Apple Intelligence・Google Gemini Nano・Microsoft Copilot+ PCsなど大手も同様のローカル・クラウド連携を進めており、Perplexityが主張する「タスク単位の動的ルーティング」の優位性が実環境で証明されるかが今後の焦点となります。製品の一般提供は数週間以内を予定しています。

Microsoft、ローカルAI開発機Surface RTX Spark Dev Box発表

ハードウェアの特徴

128GB統合メモリ搭載
NVIDIA Blackwell世代RTX Spark採用
1200億パラメータモデル実行可能
3Dプリント筐体が放熱板兼用

開発者向け戦略

クラウド従量課金への対抗策
VS Code・Copilot等を事前構成
Mac MiniとのCUDA優位性主張
3層ハードウェア戦略の中核製品

Microsoftは2026年6月2日、開発者カンファレンスBuild 2026でSurface RTX Spark Dev Boxを発表しました。NVIDIAArm系Blackwell世代RTX Sparkプロセッサと128GBの統合メモリを搭載した小型デスクトップ機で、1ペタフロップスのAI演算性能を備えます。開発者クラウドにAPIコールを送ることなく、1200億パラメータ超の大規模AIモデルをローカルで実行できます。米国で年内発売予定ですが、価格は未公表です。

この製品はMicrosoftにとって重要な戦略転換を意味します。Azure クラウドで数百億ドルの収益を上げる同社が、あえてクラウド依存を減らすハードウェアを投入するからです。Windows+Devices担当EVPのPavan Davuluri氏は、10万トークンのコンテキストだけでキーバリューキャッシュが40〜50GBを消費すると説明し、128GBの統合メモリプールの必然性を強調しました。Microsoftはこの動きを「フロンティアモデルへの呼び出しは本当にフロンティアな問題にだけ使い、残りは自前のハードウェアで処理する」と位置づけています。

筐体設計にも特徴があります。アルミ製トップパネルは金属3Dプリントで製造され、CNC加工では不可能な複雑な内部形状により、約100ワットの連続負荷を静音で冷却します。ソフトウェア面では、Windows 11 Proがイメージレベルで開発者向けに最適化されており、ダークテーマ、Developer Mode有効化、PowerShell 7デフォルト、WSL 2のGPUパススルーとCUDA対応が出荷時に構成済みです。

競合となるApple Mac Miniとの比較について、Davuluri氏は「意図的に異なる性能クラス」と述べました。M4 Pro搭載Mac Miniの統合メモリは最大48GB、M4 Maxでも128GBですが、Dev Boxは128GBに加えてBlackwell級GPUCUDAエコシステムを活用できます。PyTorch、TensorRT、llama.cppなど主要AIフレームワークの大半がNVIDIA向けに最適化されている点で、Apple Siliconに対する移植性の優位を主張しています。

本製品はMicrosoftの3層ローカルAI戦略の中核です。モバイル向けのSurface Laptop Ultra、デスクトップ向けの本機、そして1兆パラメータ対応のDGX Station for Windowsという階層構成で、「従量課金なしの知能」を掲げます。GitHub Copilot CLIの新機能/fleetでは、クラウドエージェントがタスクの複雑度を判定し、適切なサブタスクをローカルモデルに振り分ける仕組みも導入されます。クラウドAIの経済性に疑問が広がるなか、ローカルとクラウドの両端を押さえる戦略が奏功するか注目されます。

Microsoft Build 2026、AIエージェント全面展開へ7大発表

AIエージェント基盤の刷新

ScoutOpenClaw基盤の常駐AIアシスタント
M365連携でカレンダー・メール・経費を自動処理
Project Solaraエージェント専用Android OS
エージェント安全実行のMXCコンテナ提供

自社モデルとハードウェア強化

MAI-Thinking-1:初の自社推論モデル公開
Surface RTX Spark Dev Box:128GB統合メモリ搭載
Windows 11に開発者最適化モード追加
Majorana 2量子チップで実用化を2029年目標に

Microsoftは2026年6月2日、サンフランシスコで開催した年次開発者会議Build 2026で、AIエージェントを事業戦略の中核に据える7つの主要発表を行いました。CEOのサティア・ナデラ氏が基調講演に登壇し、新ハードウェアからAIモデル、量子コンピューティングまで多岐にわたる製品を披露しています。

最大の目玉は、オープンソースAIプラットフォームOpenClawをベースに構築した常駐型AIアシスタントScout」です。Microsoft 365のOutlook・OneDrive・Teamsと連携し、カレンダー管理やメール作成、経費処理などを従業員に代わって自動実行します。従来のCopilotがアプリ内に閉じた支援だったのに対し、Scoutは電話連絡まで行う「初の本格的パーソナルアシスタント」と位置づけられています。

ハードウェア面では、NVIDIAArmRTX Sparkチップと128GBの統合メモリを搭載した小型開発機「Surface RTX Spark Dev Box」を発表しました。最大1200億パラメータのモデルをローカルで実行可能で、AI開発者向けにVisual Studio CodeやGitHub Copilotをプリインストールしています。またAndroidベースの新OS「Project Solara」では、スマートスピーカー型やバッジ型のコンセプトデバイスを披露し、エージェント駆動型ガジェットの構想を示しました。

AI モデル開発ではOpenAI依存からの脱却を加速させ、初の自社推論モデルMAI-Thinking-1」を含む7つの新モデルを公開しました。MAI-Thinking-1は350億のアクティブパラメータと128Kコンテキストウィンドウを持ち、外部モデルからの蒸留なしでゼロから学習したと説明しています。エージェントの安全性確保に向けては、OS レベルのサンドボックス環境「Microsoft Execution Containers(MXC)」も導入しました。

量子コンピューティング分野では次世代チップMajorana 2」を発表し、量子ビットの信頼性を前世代比1,000倍に向上させたとしています。新素材スタックとAI支援設計の組み合わせにより、2029年までに実用的な量子コンピュータの実現を目標に掲げました。今回のBuildはAIエージェント時代に向けた全方位戦略を鮮明にした内容で、Google I/OやApple WWDCとの競争が一段と激しくなっています。

NVIDIA、AIエージェントPC向け新CPUをComputexで発表

新チップRTX Spark

1ペタフロップのAI性能
128GB統合メモリ搭載
20コアCPUArm設計
今秋に主要メーカーから発売

200B市場の野望

黄CEOがCPU新成長源と表明
MicrosoftやDellなど提携
ローカルエージェントを安全実行

半導体大手NVIDIAは6月1日、台湾Computexで新型PC向けCPU「RTX Spark」を発表しました。1ペタフロップのAI処理性能と128GBの統合メモリを備え、OpenClawなどのAIエージェントをPC上で安全に動かす「スーパーチップ」と位置付けます。搭載するWindows PCは今秋、ASUS、Dell、HP、Lenovo、Microsoft Surface、MSIから発売される予定です。

創業者ジェンスン・フアンCEOは、アプリを起動してクリックや入力を繰り返す従来の操作を終わらせたい考えです。「頼めばPCが仕事をする」と述べ、フロンティアモデルや創作ワークフロー、ゲームをすべてノートPC上で実現すると強調しました。同氏は先月の決算で、GPUに加えCPU販売で2000億ドル規模の新市場を見出したと投資家に語っています。

技術面では、Microsoftと共同開発したセキュアなサンドボックスを備え、エージェントを安全に隔離して実行します。NVIDIA OpenShellランタイムがエージェントの権限を制御し、プライバシー方針に応じてクエリをローカルモデルへ振り分けたり、クラウド送信時に個人情報を匿名化したりします。Adobeはこのチップ向けにPhotoshopとPremiereを再設計し、AI処理を最大2倍高速化するとしています。

もっとも、NVIDIAArmベースのWindows機に挑むのは初めてではありません。2013年にはMicrosoftArm搭載のSurface RTで9億ドルを減損した過去があります。今回のチップはより高性能で、MicrosoftはSurface Laptop Ultraを「最も強力なSurface」と銘打ちますが、各社は価格などの詳細をまだ明らかにしていません。

The Vergeはこれを「Windows版M1の瞬間」になり得ると評価しつつ、価格を懸念します。RTX SparkはDGX Spark(約4800ドル)のWindows版とみられ、128GBメモリ搭載機は高額化が避けられません。AppleがM1で安価なMac MiniやMacBook Airから普及を進めたのに対し、NVIDIAは2000ドル超の高価格帯から始める構えで、消費者の支出余力が細るなか普及の壁になりそうです。

それでも、Riot Gamesがアンチチート機能をArmに対応させるなど、Windows on Armの弱点だったゲーム互換性の改善も進みます。Intel、AMD、Qualcommに続く第4の選択肢として、NVIDIAが安全で使いやすいAIエージェントを大衆に届けられるかが今後の焦点となります。

Microsoft、Buildで初の推論AI公開へ

新AIモデルを発表

初の推論モデルMAI-Thinking-1
蒸留不使用で独自開発
画像生成MAI-Image-2.5系も
Copilot統合アプリを予告

Windows刷新を強調

開発者向け最適化環境を投入
Windows 11の性能改善継続
ローカルAI実行を重視
GitHub信頼回復が課題

Microsoftは現地時間6月2日、サンフランシスコで開発者会議「Build」を開幕します。同社はAIを軸に事業全体を再編する中で、自社初の推論AIや刷新されたWindows開発環境を披露し、低下した開発者の信頼の回復を狙います。AIチップやアプリ統合まで、AI時代の方向性を示す節目の催しと位置づけられます。

最大の目玉は、AI部門を率いるムスタファ・スレイマン氏が公開する見込みの推論モデルMAI-Thinking-1」です。他社AIの出力を学ぶ蒸留を用いずに自社開発した点が特徴で、主に企業利用を想定しているといいます。あわせて画像生成の「MAI-Image-2.5」と高速版「Flash」も登場が見込まれます。

利用者向けには、複数のCopilotアシスタントを一つにまとめる「スーパーアプリ」構想も語られます。ただし開発途上のため会場での提供はなく、プレビュー公開は夏の終わり頃の見通しです。流出した画面はBuildのデモ用モックアップにすぎないと報じられています。

Windowsでは、開発者が求めてきた集中できる作業環境を備えた「開発者最適化版Windows 11」を初公開する見込みです。同社が年初に示した性能改善計画に沿い、一部の書き換えによる動作の高速化も進めているとされます。

ハードウェア面では、Nvidiaの新シリコン「RTX Spark」への対応が焦点です。今年のBuildではローカルモデルの実行に重点が置かれ、開発者は高価なクラウドに頼らず手元の計算資源を活用できるようになります。サティア・ナデラCEOはNvidiaジェンスン・フアン氏と新製品を議論し、QualcommとのArmWindows強化も話題に上る見通しです。

一方で課題も残ります。Microsoft買収子会社GitHubで人材流出や障害、セキュリティ問題が相次ぎ、著名開発者から警鐘が鳴らされています。Buildの運営をGitHubチームが一部担う今回、同社が信頼回復へ具体策を示せるかが問われています。会議は日本時間6月3日未明に始まります。

ASIC設計者が語る学術界と産業界の決定的な違い

産業界が求める設計思想

新規性より信頼性と再現性を重視
先端ノードのマスク費用は数千万ドル規模
初回シリコン成功が絶対条件
検証は不良率100万分の1単位で管理

シリコンIPの役割と今後

先端チップ物理面積80%が外部IP
設計コスト高騰でIP再利用が不可欠に
ASIC市場は2033年に388億ドル予測
学術と産業の連携が次世代人材の鍵

IEEE Fellowで半導体IP企業Silicon Creationsのシニア設計者であるMaysam Ghovanloo氏が、約30年にわたるASIC設計キャリアを通じて感じた学術界と産業界の根本的な違いを解説しています。同氏は大学教授から2019年に産業界へ転身し、研究で培った知識が直接通用しない場面に直面したといいます。

学術界と産業界の最大の違いは目的にあります。学術界では新しい回路技術や設計手法の新規性の実証が成功の基準ですが、産業界では仕様どおりに動作し、量産で歩留まりを確保し、スケジュールどおりに納品することが求められます。先端プロセスではリソグラフィマスクだけで数千万ドルの費用がかかるため、リスクを体系的に排除する設計手法が不可欠です。

こうした背景からシリコンIPの活用が広がっています。現在の先端チップでは物理面積の約80%をArm、Cadence、Synopsysなどが提供する既製のIPブロックが占めています。ソフトウェア開発者が既存ライブラリを使うように、ASIC設計者もプロセッサコアやメモリインターフェースなどの検証済みブロックをライセンスし、システムレベルの統合に注力しています。

検証の考え方も大きく異なります。学術界では試作40個のうち最初の5〜10個が動けば論文には十分ですが、産業界では不良率を100万分の1単位で管理し、わずかな異常も原因を特定して再発防止を図ります。プロジェクトの時間軸も、学術界の柔軟なサイクルに対し、産業界は固定されたスケジュールと市場投入時期に縛られています。

ASIC市場は自動車やAI向け需要の拡大により、2033年までに234億ドルから388億ドルへの成長が見込まれ、半導体産業全体も2030年に1兆ドル到達が予測されています。同氏は「学術界は何が可能かを探求し、産業界は何がスケールで実現可能かを見極める」と述べ、両者の視点を理解することが次世代エンジニアにとって不可欠だと強調しています。

NVIDIA Vera CPUが性能記録を更新

ベンチマーク結果

x86 128コア品に1.5倍の総合性能
前世代Graceから1.6倍の世代間向上
Linuxカーネルを20秒でコンパイル
AMD EPYC 9575Fを10%上回る

メモリと設計の優位性

LPDDR5Xで1.2TB/sの帯域幅
メモリ消費電力30W未満、DDR5比で大幅削減
88コアのモノリシックダイ構成

提供と展望

主要AI企業やCSPに初期出荷済み
2026年後半にパートナーから一般提供

NVIDIAは2026年5月26日、独自設計のCPU「Vera」の初のベンチマーク結果を公開しました。テスト結果を掲載したPhoronixの創設者Michael Larabel氏は、「Intel・AMDのx86_64プロセッサに対してこれまでに見たことのない最も手強い競合」と評価しています。VeraはAIエージェント処理に最適化されたデータセンター向けCPUで、Armv9.2互換の独自Olympusコアを88基搭載しています。

性能面では、最新世代の128コアx86プロセッサに対して1.5倍の総合性能優位を示しました。前世代のGrace CPUとの比較では1.6倍の世代間向上を達成し、Linuxカーネルのコンパイルを20秒で完了するなど、Phoronixが計測した中で最速の結果を記録しています。AMD EPYC 9575F(5.0GHz)との比較でも幾何平均で10%上回りました。

メモリ性能も大きな差別化要因です。第2世代LPDDR5Xサブシステムにより、最大1.2TB/sの帯域幅を30W未満の消費電力で実現しました。従来のDDR5が100W以上を消費するのに対し、大幅な電力効率の改善となります。STREAM TRIADテストではピーク帯域幅の90%を維持し、コアあたりのメモリ帯域幅はx86 CPUの4倍以上に達しました。

Veraはコード実行、サンドボックス処理、データベースクエリなど、AIエージェントが日常的に行うCPU負荷の高いタスクに特化して設計されています。Prime Intellectの別テストでは、並列ワークロード増加時にも高帯域幅と低遅延を安定して維持できることが確認されました。

NVIDIAはすでに主要AI企業やクラウドプロバイダーに初期出荷を完了しており、2026年後半にパートナー各社からシングルソケットおよびデュアルソケット構成で提供が開始される予定です。空冷・液冷の両方に対応し、標準的なデータセンターから高密度AIインフラまで幅広い導入形態をカバーします。

AIフィッシング対策のOceanが2800万ドル調達

Oceanの技術と実績

AI特化のメール防御基盤
独自小規模言語モデルで送信者意図を解析
月間数十億通のメールを処理
Kayak・Kingston等が顧客

創業者の経歴と資金調達

元ハッカーからイスラエル防衛研究者に転身
Lightspeed主導で2800万ドル調達
Wiz創業者ら著名エンジェルも参加
ステルスモードから正式公開

AIを悪用したフィッシング攻撃に対抗するメールセキュリティスタートアップOceanが、ステルスモードを脱し累計2800万ドル(約42億円)の資金調達を発表しました。ラウンドはLightspeed Venture Partnersが主導し、Picture CapitalやCerca Partnersが参加しています。Wizの共同創業者アサフ・ラパポート氏や、ServiceNowに77.5億ドルで売却されたArmisの共同創業者らも個人投資家として名を連ねました。

創業者のシャイ・シュワルツ氏は、16歳でハッカーとして活動した後、サイバーセキュリティの防御側に転じた経歴を持ちます。イスラエルの精鋭防衛・情報部隊で約10年間にわたり主要プロジェクトを率い、アイアンドーム関連の研究にも携わりました。その後、HPEに買収されたAxisを経て、2年前にOceanを設立しました。

シュワルツ氏は、従来の高度なスピアフィッシングには膨大な手作業が必要でしたが、AIがその全工程を自動化し攻撃の規模が急拡大していると指摘します。LLMにターゲットの公開情報を収集・分析させ、個人に最適化したフィッシングメールを大量生成できる時代になったと警鐘を鳴らしています。

Oceanはメール分析に特化した小規模言語モデルを独自開発し、受信メールごとに送信者の意図を解析して、受信者の組織的コンテキストと照合することで詐欺やなりすましを検出します。すでにKayak、Kingston Technology、Headspaceなどの企業が顧客となり、月間数十億通のメールを処理しています。ProofpointやMimecastといった既存ベンダーとは異なり、AI時代に即した防御アプローチを提供する点が差別化要因です。

Perceptron Mk1、動画解析AIを大手比80〜90%安で提供開始

圧倒的な低コスト戦略

入力100万トークンあたり0.15ドル
GPT-5Gemini 3.1 Proの80〜90%安
フロンティアモデル級の性能を低価格帯で実現

動画理解の技術的優位性

最大2FPS・32Kトークンの連続動画処理
物理法則を理解した時空間推論能力
ピクセル精度の物体追跡とカウント

産業応用と事業展開

スポーツ・製造・ロボティクス分野で実導入開始
オープンウェイトのIsaacシリーズも並行展開

スタートアップPerceptronは2026年5月12日、独自開発の動画解析推論モデルMk1」を発表しました。入力100万トークンあたり0.15ドル、出力100万トークンあたり1.50ドルという価格設定で、AnthropicClaude Sonnet 4.5、OpenAIGPT-5GoogleGemini 3.1 Proと比較して80〜90%低いコストで利用できます。

Mk1の最大の特徴は、動画を静止画の連続ではなく時間的連続性を保って処理する点にあります。最大2FPSで32Kトークンのコンテキストウィンドウを活用し、遮蔽物越しでも物体の同一性を維持できます。空間推論ベンチマークのEmbSpatialBenchでは85.1を記録し、GoogleのRobotics-ER 1.5(78.4)を上回りました。

同モデルは物理推論を強みとしており、物体の動きや相互作用を時空間的に理解できます。バスケットボールのシュートがブザーの前か後かを判定するといった、因果関係の把握が求められるタスクにも対応します。アナログ計器の読み取りや、密集シーンでの数百単位のカウントも高精度で実行可能です。

創業者Armen Aghajanyan CEOとAkshat Shrivastavaは、いずれもMeta FAIRの出身です。2024年11月にワシントン州ベルビューでPerceptronを設立し、Metaで手掛けたマルチモーダル基盤モデルの研究を物理AIの領域へと発展させました。16カ月の開発期間を経て今回のリリースに至っています。

すでにスポーツ中継のハイライト自動切り出しや、製造ラインでの品質検査、ロボティクスの訓練データ生成といった実運用が始まっています。エッジ向けにはオープンウェイトのIsaacシリーズ(最新は0.2-2bプレビュー)も提供しており、200ミリ秒未満の応答速度でリアルタイム処理に対応します。APIとオープンウェイトの二本立てで、企業用途からコミュニティまで幅広い展開を狙います。

Kimi K2.6が数日間稼働するAIエージェントを実現

長時間エージェントの実力

最長5日間の自律稼働を実証
300サブエージェント・4000ステップ同時実行
SySYコンパイラを10時間で構築
8年物のOSSコードを13時間で刷新

オーケストレーションの課題

既存フレームワークは短時間前提の設計
状態管理とロールバックが未整備
ガバナンスが導入速度に追いつかず
エージェント専用インフラの概念が未成熟

中国のAIスタートアップMoonshot AIは2026年4月、新モデルKimi K2.6を発表しました。同モデルは長時間にわたり自律的に稼働するAIエージェントを想定して設計されており、社内テストでは最長5日間の連続実行に成功しています。モデルはHugging Face、API、Kimi Codeなどを通じて公開されました。

Kimi K2.6の特徴は、独自の「Agent Swarms」アーキテクチャにあります。最大300のサブエージェントが4000ステップを同時に処理でき、事前定義された役割ではなくモデル自身がオーケストレーションを判断します。AnthropicClaude CodeOpenAICodexも長時間エージェントを模索していますが、K2.6はより動的な制御を目指しています。

実証実験では、SySYコンパイラを10時間で一から構築し、140件の機能テストをすべて通過しました。Moonshot AIはこれを「エンジニア4人が2カ月かかる作業に相当する」と説明しています。また、8年間運用されたオープンソースの金融マッチングエンジンの改修では、13時間で12の最適化戦略を試行し、1000回以上のツール呼び出しで4000行超のコードを修正しました。

一方、長時間稼働するエージェントは既存のオーケストレーション基盤の限界を露呈させています。大半のフレームワークは数秒から数分の実行を前提に設計されており、環境変化に応じた状態管理や障害時のロールバックが十分に整備されていません。専門家は「エージェントランタイム」「エージェントゲートウェイ」「エージェントメッシュ」といった新たなインフラ概念の必要性を指摘しています。

セキュリティ企業ArmorCodeのMark Lambert氏は、AIエージェントがコードやシステム変更を生成する速度が組織のレビュー能力を超えつつあると警告しています。F5のKunal Anand氏も、エージェントが「永続的インフラ」として機能する時代に入ったと述べ、APIゲートウェイのパターン自体が目標やワークフローを理解する形へ進化する必要があると指摘しました。

GoogleとIntel、AI基盤で多年提携を拡大

提携の中身

Xeon 6をGoogle採用
多年契約で関係強化
カスタムIPU共同開発継続
ASIC基盤IPUに集中

CPU争奪戦の背景

CPU不足が業界課題
GPU偏重からバランス型へ
Arm AGI CPU競争参入

GoogleIntelは4月9日、AIインフラ分野での多年にわたる提携を拡大すると発表しました。Google Cloudは引き続きIntel製Xeonプロセッサを採用し、最新のXeon 6をAI・クラウド推論用途に活用します。両社は2021年から続くカスタムIPUの共同開発も継続し、ASICベースの設計に注力する方針です。

Google Cloudは過去数十年にわたりIntel製Xeonプロセッサを使い続けてきました。今回新たに採用が明確化されたXeon 6は、生成AI時代のクラウド推論処理を支える基幹部品となります。長期にわたる信頼関係を軸に、両社は基盤構築のパートナーシップを一段と深めます。

提携のもう一つの柱が、カスタムIPUの共同開発です。IPUはCPUからネットワーク処理やデータ管理といった作業を引き受け、データセンター全体の効率を底上げします。2021年に始まったこの取り組みは、今後ASICベースの設計に焦点を絞って進められる予定です。

この拡大の背景には、業界全体を覆うCPU不足があります。モデルの開発や学習にGPUが使われる一方、完成したAIモデルの実行や推論、そしてインフラ全般の運用にはCPUが欠かせません。Intelのリップブー・タン最高経営責任者は「AIには加速器だけでなくバランスの取れたシステムが必要だ」と強調しています。

CPUへの回帰はGoogleIntelだけではありません。SoftBank傘下のArm Holdingsは先月、創業35年で初の自社設計チップとなるArm AGI CPUを発表しました。世界的なCPU不足を背景に、半導体各社の競争はAI基盤の中核部品へと広がっています。

富裕層がVC経由せずAI企業へ直接投資を加速

直接投資の急増

2月のファミリーオフィス直接投資41件
83%がAIを最重要戦略と回答
VC仲介を省き経営参画も増加
自らAI企業を創設する動きも拡大

集中投資の戦略

Arena社がPositronに2.3億ドル出資
年間数件の厳選投資で取締役席確保
第三者による技術検証を徹底
分散投資ではなく一点集中の方針

AIブームを背景に、ファミリーオフィスや富裕層がベンチャーキャピタルを介さずAIスタートアップへ直接投資する動きが加速しています。投資顧問会社Arena Private Wealthの創業者ミッチ・スタイン氏は、企業が長期間非公開のまま成長しIPOが減少するなか、上場前の段階で大きなリターンが生まれていると指摘しました。同氏は「AIへのエクスポージャーを持たないことこそ最大のリスクだ」と述べています。

BNY Wealthの調査によると、ファミリーオフィスの83%が今後5年間でAIを最重要戦略と位置づけており、半数以上がすでに投資を通じてAIへのエクスポージャーを持っています。2026年2月には41件の直接投資が行われ、ローレン・パウエル・ジョブズ氏のEmerson CollectiveによるWorld Labs投資など著名な事例が相次ぎました。

一部のファミリーオフィスはさらに踏み込み、自らAI企業をインキュベートしています。ジェフ・ベゾス氏ロボティクス企業のCEOに就任し、初回調達で62億ドルを集めた事例はその象徴です。元Silicon Labs CEOのタイソン・タトル氏もAI製造スタートアップCircuitを共同創業し、自身のファミリーオフィスから500万ドルを出資しました。

Arena Private Wealthは2026年2月にAIチップスタートアップPositronの2億3000万ドルのラウンドを共同リードし、取締役席を獲得しました。同社は年間数件の直接投資に限定し、ポートフォリオ全体のリターン管理ではなく個別案件ごとに成功を追求する集中型の投資戦略を採用しています。第三者の技術検証やArmの出資参加などを投資判断のシグナルとして重視しており、創業者との強い利害一致を強みとしています。

Meta、AI投資加速の裏で数百人規模の人員削減を実施

削減の全体像

数百人が対象の人員整理
採用・SNS・営業チームに影響
Reality Labs部門も対象
社内異動で対応する方針

AI転換の加速

AI投資最大1350億ドル計画
1月にもReality Labs1000人超削減
VRスタジオ3拠点を閉鎖
メタバース事業の大幅縮小

Metaは2026年3月、採用・ソーシャルメディア・営業チームおよびReality Labs部門を含む複数部門で数百人規模の人員削減を実施しました。同社は2025年12月時点で約7万9000人の従業員を抱えています。

同社の広報担当者は「各チームは目標達成に最適な体制を整えるため、定期的に組織再編や変更を行っている」と声明を発表しました。影響を受ける従業員には社内で別のポジションを提供する方針ですが、具体的な削減人数は明らかにしていません。

Metaは近年、社名の由来となったメタバース事業から距離を置く姿勢を鮮明にしています。1月にはReality Labsチームで少なくとも1000人を削減し、VRスタジオ3拠点の閉鎖やビジネス向けメタバースプラットフォームの終了を発表しました。

一方で同社はAIデータセンターの建設に最大1350億ドルを投じる計画を掲げ、Armの最新CPUを採用するなどAIインフラへの大規模投資を加速させています。経営資源の配分がVR・メタバースからAIへと明確にシフトしています。

VRフィットネスアプリ「Supernatural」の新コンテンツ停止や、3Dソーシャルプラットフォーム「Horizon Worlds」のVR版終了発表と撤回など、VR関連事業は迷走が続いています。今回の削減は、AI中心の経営戦略への本格移行を改めて印象づけるものです。

Armが自社初のデータセンター向けCPUを発表、Metaが初期顧客に

自社チップ参入の衝撃

Arm AGI CPUを正式発表
初の自社シリコン製品で歴史的転換
Metaが最初の顧客に決定
SK Hynix・Cisco・SAP等も採用予定

技術と市場戦略

世界最高の電力効率を実現
エージェントAI処理に最適化
TSMCで製造、サーバー参照設計も提供
Intel・AMDのx86市場を直接侵食

Armは、同社初となる自社設計・製造のデータセンター向けCPU「Arm AGI CPU」を発表しました。これまで設計ライセンス事業に徹してきた同社にとって、自社シリコンへの参入は創業以来最大の戦略転換となります。初期顧客としてMetaが採用を決定しています。

CEO のルネ・ハース氏は、ArmがIP企業から「コンピュートプラットフォーム企業」に進化したと説明しました。MicrosoftがSurfaceでWindowsエコシステムを強化し、GooglePixelAndroidを推進するのと同様に、Armも自社チップエコシステム全体を底上げする狙いがあると述べています。

新CPUの最大の強みは電力効率です。モバイルチップで培った省電力設計のDNAを活かし、AI時代のデータセンターが直面するエネルギー問題に対応します。さらに、エージェントAIの実行にはGPUではなくCPUが不可欠であり、この需要拡大がArm参入の追い風となっています。

製造はTSMCが担当し、Super MicroやFoxconnと協力してサーバー参照設計も提供します。ハース氏は約2,000人エンジニアを関連部門に増員したと明かしました。既存のコンピュートサブシステムで実績があるため、初号機から高い完成度を自信を持って見込んでいます。

この動きはIntelAMDのx86勢にとって直接的な脅威となります。一方、NvidiaのVera CPUもArm ベースであるため、Armエコシステムの拡大はNvidiaにもプラスに働くとハース氏は主張。ソフトバンク孫正義会長とは日常的に連携しており、今回の決断もパートナーとしての議論を経て進めたと語りました。

Armが35年の歴史で初の自社製CPU発表、Metaが最初の顧客に

AGI CPUの概要

Neoverseベースの推論特化CPU
最大136コア搭載構成
TSMC3nmプロセスで製造
x86比2倍電力効率を主張

顧客と市場展望

Metaが共同開発・初号顧客
OpenAICerebras等も採用予定
2026年後半に量産出荷開始
DC向けCPU市場は2030年に1000億ドル規模へ

Armは2026年3月、サンフランシスコで開催したイベントにおいて、創業以来初となる自社製CPU「Arm AGI CPU」を発表しました。同社はこれまでチップ設計のライセンス供与に徹してきましたが、AI需要の急拡大を受けて自社製造に踏み切りました。

AGI CPUはAIエージェント推論処理に特化したデータセンター向けプロセッサです。最大136コアを搭載し、TSMCの3nmプロセスで製造されます。従来のx86アーキテクチャ製品と比較して、ワットあたり性能が2倍に達すると同社は主張しています。

Metaが共同開発パートナー兼最初の顧客として名乗りを上げました。Meta基盤部門責任者のサントシュ・ジャナルダン氏は「チップ業界を複数の軸で拡大する」と期待を示しています。同社は「パーソナル超知能」の実現に向け、電力効率の高いシリコンを求めています。

OpenAICerebrasCloudflare、SAP、SK Telecom、Rebellionsなども採用を表明しました。NvidiaAmazonGoogleの幹部もビデオメッセージで支持を表明しましたが、購入の確約には至っていません。量産出荷は2026年後半を予定しています。

調査会社Creative Strategiesは、データセンター向けCPU市場が2026年の250億ドルから2030年には600億ドルに成長すると予測しています。エージェントAI向けCPUを含めると市場規模は1000億ドルに達する見通しです。一方、Armが自社チップを投入することで、既存ライセンス先との競合関係が生じるリスクも指摘されています。

NVIDIAと通信大手6社がAIグリッド構築へ

通信網のAI基盤化

AT&T;がIoT向けAIグリッド構築
Comcastが低遅延ブロードバンド活用
Spectrumが1000超のエッジ拠点展開
T-MobileがエッジAI応用を検証

分散推論の実用化

Personal AIが500ms以下の遅延実現
Linker Visionが都市運営を変革
Decartが12ms以下のリアルタイム映像生成

エコシステム拡大

Cisco・HPEがフルスタック提供
Blackwell GPU搭載システムで展開

NVIDIAは GTC 2026において、AT&T;Comcast、Spectrum、Akamai、Indosat、T-Mobileの通信大手6社と連携し、地理的に分散したAI推論基盤「AIグリッド」の構築を発表しました。通信網をAI配信の中核に据える構造的転換が進んでいます。

世界の通信事業者は約10万カ所の分散データセンターを運営しており、余剰電力100ギガワット超に達します。AIグリッドはこの既存資産を活用し、ユーザーやデバイスの近くでAI推論を実行することで、応答速度の向上とトークンあたりコストの最適化を同時に実現します。

AT&T;はCiscoおよびNVIDIA提携し、IoT向けAIグリッドを構築します。公共安全などミッションクリティカルな用途で、リアルタイムのAI推論ネットワークエッジで処理し、機密データの顧客管理を維持しながら検知・警報・対応を高速化します。

ComcastNVIDIAやHPEと連携し、会話エージェントクラウドゲーミングの需要急増時でも高スループットと低コストを維持できることを実証しました。Akamaiは4400超のエッジ拠点に数千基のBlackwell GPUを配備し、リクエストごとに最適な計算層へ振り分けるオーケストレーション基盤を構築しています。

インドネシアのIndosatは国内にソブリンAI基盤を整備し、現地語対応のAIプラットフォーム「Sahabat-AI」を展開します。T-Mobileはスマートシティや配送ロボットなど物理AIの実証を進めており、セルサイトが5G通信と分散AI処理を両立できることを示しています。

NVIDIAAIグリッドリファレンスデザインを公開し、分散拠点でのAI展開に必要なコンピューティング・ネットワーキング・ソフトウェアの構成要素を定義しました。Cisco、HPE、Armada、Rafayなどのパートナーがフルスタックソリューションの市場投入を進めており、通信事業者がAIバリューチェーンで新たな収益源を確保する動きが加速しています。

HuggingFace、LeRobot v0.5.0でヒューマノイド対応と6つの新ポリシーを追加

ハードウェア拡張

Unitree G1ヒューマノイド初対応
全身協調制御(WBC)の実現
OpenArmロボットアームの統合
CANバスモーター対応で高性能化

AIポリシーと高速化

Pi0-FAST自己回帰VLAの導入
Real-Time Chunkingで推論の応答性向上
LoRA/PEFTで大規模VLAの効率微調整
画像学習10倍高速化を実現

エコシステム整備

EnvHubでHub上のシミュレーション環境を直接利用
NVIDIA IsaacLabとのGPU並列学習統合
サードパーティポリシープラグイン対応
ICLR 2026採択で学術的評価を獲得

Hugging Faceは2026年3月にオープンソースロボット学習フレームワーク「LeRobot」のv0.5.0をリリースした。同バージョンでは初のヒューマノイドロボット対応や6つの新ポリシー追加、データパイプラインの大幅な高速化など、あらゆる次元でのスケールアップが実現されています。

最大のハードウェア追加はUnitree G1ヒューマノイドの全面サポートです。歩行・ナビゲーション・物体操作・遠隔操作に加え、全身協調制御(WBC)により移動と操作を同時実行できる。これはLeRobotが卓上アームを超えた汎用ロボティクスへ踏み出す重要な一歩となっています。

ポリシー面ではPi0-FASTが注目されます。Gemma 300Mベースの自己回帰型アクションエキスパートを採用し、FASToトークン化によって離散化されたアクション列を生成します。また推論技術のReal-Time Chunking(RTC)は、フローマッチングポリシーの応答性を劇的に改善し、実世界デプロイでのレイテンシ問題を解消します。

データセットパイプラインではストリーミングビデオエンコーディングの導入により、エピソード記録後のエンコード待ち時間がゼロになりました。さらに画像学習が最大10倍、エンコードが3倍高速化されており、データ収集からモデル訓練までのサイクルが大幅に短縮されています。

コードベース面ではPython 3.12+とTransformers v5への移行が完了し、サードパーティポリシープラグインシステムの導入でエコシステムの拡張性が向上しました。EnvHubとNVIDIA IsaacLab-Arenaの統合により、シミュレーション環境の共有・活用も容易になっています。同論文はICLR 2026にも採択されており、学術コミュニティからの評価も高まっています。

NvidiaがCES 2026でVera Rubinプラットフォームを正式発表

Vera Rubin:次世代AIチップの全貌

Vera Rubinが2026年後半に顧客向け出荷開始
「フル生産」状態とJensen Huangが宣言
前世代比で大幅な性能向上を実現
NVLink Fusionで他社チップとの統合も可能
HBM4メモリ搭載でメモリ帯域幅が飛躍的増大
AI推論・学習の両用途で競合を大きく引き離す

MicrosoftAzureとのエコシステム整備

AzureがRubin対応インフラをすでに計画済み
MicrosoftNvidiaの長期戦略的パートナーシップ
大規模クラスター展開をシームレスに実現
データセンター設計にRubinを前提とした最適化
電力密度とラック設計が新たな工学的課題
ハイパースケーラー全社がRubin対応を急ぐ

NvidiaのCEO Jensen HuangはラスベガスのフォンテーヌブローホテルでCES 2026の基調講演を行い、次世代AIコンピューティングプラットフォーム「Vera Rubin」が正式に生産フェーズに入ったと発表した。2026年後半から主要顧客への出荷が開始される予定だ。

Vera Rubinは前世代のBlackwellから大幅な性能向上を実現しており、AI学習・推論の両用途で競合を引き離す。特に注目されるのはNVLink Fusion技術で、他社製のCPU(ArmIntel)とも組み合わせて使用できる柔軟なアーキテクチャを提供する。

MicrosoftのAzureチームは、Rubinプラットフォームのデプロイに向けてデータセンターの長期計画を進めていることを明らかにした。大規模なNvidiaクラスターを効率的に展開するためのインフラ設計が完了しており、出荷と同時に即座に活用できる体制が整っている。

RubinのアーキテクチャはHBM4メモリを採用し、メモリ帯域幅と容量の両面で大幅な向上を実現している。これにより、より大きなモデルのより高速な推論が可能となり、エンタープライズAIアプリケーションの応答性が大幅に改善される。

電力密度の増加に伴い、データセンター冷却電力インフラの再設計も必要となる。液体冷却システムの採用が業界標準化しつつあり、エネルギー効率の向上と持続可能性の確保が新たな設計要件となっている。

Googleが管理型MCP提供開始 AIと実データの連携を簡易化

AI開発の工数を大幅削減

マネージドMCPサーバーをプレビュー公開
MapsやBigQuery等と即座に連携可能
独自コネクタ開発が不要、URL設定のみ

既存資産の活用と統制

Apigee連携で既存APIを変換可能
企業水準のセキュリティと統制を適用
Anthropic発の標準規格MCPを採用

Googleは10日、AIエージェントGoogle MapsやBigQueryなどの自社サービスに容易に接続できる「フルマネージドMCPサーバー」を発表しました。従来開発者が手動で構築していたコネクタ部分をGoogleが管理・提供することで、AIと実データの連携を簡素化し、開発工数の削減とガバナンスの強化を実現します。

これまでAIエージェントを外部ツールと連携させるには、複雑なコネクタの開発と維持が必要でした。今回の発表により、開発者URLを指定するだけで、安全かつ信頼性の高い接続が可能になります。Google Cloud幹部は「Google全体をエージェント対応(Agent-ready)にする設計だ」と述べています。

初期対応サービスには、Google Maps、BigQuery、Compute Engine、Kubernetes Engineが含まれます。これにより、AIは最新の地理情報に基づいた旅行計画や、大規模データへの直接クエリ、インフラ操作などが可能になります。現在はパブリックプレビューとして、既存顧客に追加コストなしで提供されています。

採用されたMCP(Model Context Protocol)はAnthropicが開発したオープンソース標準であり、ClaudeChatGPTなどの他社クライアントとも連携可能です。また、GoogleのAPI管理基盤「Apigee」を使えば、企業は既存のAPIをMCPサーバーに変換し、セキュリティ設定を維持したままAIに開放できます。

企業利用を前提に、権限管理の「IAM」や、プロンプトインジェクション等の脅威を防ぐ「Model Armor」といった高度なセキュリティ機能も統合されています。Googleが「配管工事」を担うことで、エンジニアエージェントの本質的な価値創造に集中できるようになります。

Google新AI半導体、性能4倍でAnthropicと大型契約

新チップ「Ironwood」

第7世代TPU性能4倍を実現
推論時代の需要に対応する設計
最大9,216チップを単一システム化
ArmベースCPU「Axion」も拡充

Anthropicとの提携

Anthropic最大100万個の利用契約
数十億ドル規模の歴史的契約
Claudeモデルの安定供給を確保

Google Cloudが2025年11月6日、第7世代AI半導体「Ironwood」を発表しました。従来比4倍の性能向上を実現し、AI企業Anthropicが最大100万個のチップを利用する数十億ドル規模の大型契約を締結。AIモデルの「トレーニング」から「推論(サービング)」への市場シフトに対応し、NVIDIAの牙城に挑むGoogle独自開発戦略が大きな節目を迎えました。

「Ironwood」は、AIモデルを訓練する段階から、数十億のユーザーにサービスを提供する「推論の時代」の要求に応えるべく設計されています。最大9,216個チップを単一のスーパーコンピュータとして機能させる「ポッド」アーキテクチャを採用。Google独自の高速インターコネクト技術により、膨大なデータを効率的に処理し、高い信頼性を実現します。

この新技術の価値を最も強く裏付けたのが、AIモデル「Claude」を開発するAnthropicとの契約です。最大100万個という空前の規模のチップへのアクセスを確保。これはAIインフラ史上最大級の契約と見られ、Anthropicは「価格性能比と効率性」を決定要因に挙げ、Googleの垂直統合戦略の正当性を証明する形となりました。

Googleの戦略は、AIアクセラレータ「Ironwood」に留まりません。同時に発表されたArmベースのカスタムCPU「Axion」は、AIアプリケーションを支える汎用的な処理を担当します。これらをソフトウェア群「AI Hypercomputer」で統合し、ハードとソフトの垂直統合による最適化で、NVIDIAが独占する市場に真っ向から挑みます。

この発表は、AIインフラ市場の競争が新たな段階に入ったことを示します。巨額の投資が続く中、汎用的なGPUか、特定の用途に最適化されたカスタムチップか、という路線対立が鮮明になってきました。ユーザーにサービスを届ける「推論」の重要性が増す中で、Googleの長期的な賭けが実を結ぶか、市場の注目が集まります。

グーグル、AI開発基盤を刷新 観測・統制を強化

エージェント開発を高速化

最先端のコンテキスト管理
自己修復機能付きプラグイン提供
開発キットでGo言語を追加サポート
ワンクリックでの本番環境移行

本番運用のガバナンス強化

観測ダッシュボードで稼働監視
エージェントIDによる監査証跡の明確化
プロンプト注入などを防ぐ新機能
パフォーマンスを事前評価する機能

Google Cloudは2025年11月5日、AI開発プラットフォーム「Vertex AI」の中核をなす「Agent Builder」の大規模アップデートを発表しました。この更新は、企業がAIエージェントの構想から設計、展開までをより迅速かつ安全に行えるようにするものです。主な特徴は、開発プロセスを加速する新ツール群と、本番運用に不可欠なガバナンス機能を大幅に強化した点にあります。

開発の高速化は、今回のアップデートの大きな柱です。最先端のコンテキスト管理レイヤーや、失敗したタスクを自己修復する事前構築済みプラグインを導入。開発キット(ADK)はPythonやJavaに加え、新たにGo言語をサポートしました。さらに、コマンド一つでローカル環境からテスト環境へ移行できる「ワンクリックデプロイ」機能も提供します。

同時に、企業利用で必須となるガバナンス機能も大幅に拡充されました。新たに導入された観測可能性ダッシュボードでは、トークン消費量やエラー率などを本番環境で追跡できます。また、エージェントに固有のIDを付与して監査証跡を明確にする機能や、プロンプトインジェクションを防ぐ「Model Armor」も搭載されました。

この観測可能性ダッシュボードは、開発者にとって強力なツールとなるでしょう。本番環境で稼働するエージェントトークン消費量、エラー率、レイテンシー(遅延)を可視化し、問題が発生した際の原因特定と再現を容易にします。これにより、クラウドベースでの本番監視が格段に効率化され、安定した運用が可能になります。

Google CloudがAgent Builderの強化を急ぐ背景には、熾烈な開発者獲得競争があります。OpenAIの「AgentKit」やマイクロソフトの「Azure AI Foundry」、AWSの「Bedrock」など、競合他社もAIエージェント開発基盤の機能拡充を競っています。今回のアップデートは、自社エコシステム内に開発者を留め、競争優位性を確保するための戦略的な一手と言えるでしょう。

AI開発の生産性向上、ソフトウェアの断片化解消が鍵

AI開発を阻む「複雑性の壁」

断片化したソフトウェアスタック
ハードウェア毎のモデル再構築
6割超のプロジェクトが本番前に頓挫
エッジ特有の性能・電力制約

生産性向上への道筋

クロスプラットフォームの抽象化レイヤー
最適化済みライブラリの統合
オープン標準による互換性向上
ハードとソフトの協調設計

ArmをはじめとするAI業界が、クラウドからエッジまで一貫した開発を可能にするため、ソフトウェアスタックの簡素化を急いでいます。現在、断片化したツールやハードウェア毎の再開発がAIプロジェクトの大きな障壁となっており、この課題解決が開発の生産性と市場投入の速度を左右する鍵を握っています。

AI開発の現場では、GPUやNPUなど多様なハードウェアと、TensorFlowやPyTorchといった異なるフレームワークが乱立。この断片化が非効率な再開発を招き、製品化までの時間を浪費させています。調査会社ガートナーによれば、統合の複雑さを理由にAIプロジェクトの6割以上が本番前に頓挫しているのが実情です。

このボトルネックを解消するため、業界は協調した動きを見せています。ハードウェアの違いを吸収する抽象化レイヤーの導入、主要フレームワークへの最適化済みライブラリの統合、ONNXのようなオープン標準の採用などが進んでいます。これにより、開発者はプラットフォーム間の移植コストを大幅に削減できるのです。

簡素化を後押しするのが、クラウドを介さずデバイス上でAIを処理する「エッジ推論」の急速な普及です。スマートフォンや自動車など、電力や処理能力に制約のある環境で高性能なAIを動かすには、無駄のないソフトウェアが不可欠です。この需要が、業界全体のハードウェアとソフトウェアの協調設計を加速させています。

この潮流を主導するのが半導体設計大手のArmです。同社はCPUにAI専用の命令を追加し、PyTorchなどの主要ツールとの連携を強化。これにより開発者は使い慣れた環境でハードウェア性能を最大限に引き出せます。実際に、大手クラウド事業者へのArmアーキテクチャ採用が急増しており、その電力効率の高さが評価されています。

AIの次なる競争軸は、個別のハードウェア性能だけでなく、多様な環境でスムーズに動作する「ソフトウェアの移植性」に移っています。エコシステム全体で標準化を進め、オープンなベンチマークで性能を競う。こうした協調的な簡素化こそが、AIの真の価値を引き出し、市場の勝者を決めることになるでしょう。

Meta、AIインフラ強化でArmと提携し効率化へ

提携の狙い

AIシステムを効率的に拡大
ランキング・推薦システムを移行
Arm低消費電力という強み

Metaの巨大インフラ投資

需要増に対応するデータセンター網拡張
オハイオ州で数GW規模のプロジェクト
ルイジアナ州で5GW規模の巨大施設

Nvidiaとは異なる提携

Nvidiaのような資本提携はなし
技術協力に特化した柔軟な連携モデル

ソーシャルメディア大手のMetaは2025年10月15日、半導体設計大手Armとの提携を発表しました。これは、AIサービスの需要急増に対応するため、自社のAIインフラを効率的に拡張する狙いがあります。具体的には、Metaのランキング・推薦システムをArmの「Neoverse」プラットフォームに移行させ、30億人を超えるユーザーへのサービス提供を強化します。

今回の提携の鍵は、Armワットパフォーマンス(消費電力あたりの性能)の高さです。AIの次の時代は「大規模な効率性」が定義するとArmは見ており、Metaはこの強みを活用してイノベーションを加速させます。GPU市場を席巻するNvidiaなどとは異なり、Armは低消費電力という独自の強みを武器に、AIインフラ市場での存在感を高めています。

この動きは、Metaが進める前例のない規模のインフラ拡張計画の一環です。同社はAIサービスの将来的な需要を見越し、データセンター網を大幅に拡大しています。オハイオ州では数ギガワット級のプロジェクトが進行中。さらにルイジアナ州では、完成すれば5ギガワットの計算能力を持つ巨大キャンパスの建設が2030年まで続きます。

このパートナーシップが注目されるのは、近年の他のAIインフラ取引とは一線を画す点です。NvidiaOpenAIなどに巨額投資を行うなど、資本関係を伴う提携が相次いでいるのとは対照的に、MetaArmの間では株式の持ち合いや大規模な物理インフラの交換は行われません。技術協力に特化した、より柔軟な連携モデルと言えるでしょう。