NVIDIAが提唱する「AIファクトリー」の全容

トークン生産の経済学

エネルギーをトークンに変換する新インフラ
GB300 NVL72で前世代比50倍の効率
コスト・電力・稼働率が収益を左右

フルスタック設計と展開

Vera Rubinで性能電力比さらに35倍
DSX設計でGW級施設を標準化
Omniverse双子で設計・運用を最適化

エコシステムと実績

Cisco・Dell・HPEら5社と協業
NVIDIA社内で数百のAIエージェント稼働
詳細を読む

NVIDIAは、AIの推論処理を大規模かつ常時稼働で行う新たなインフラカテゴリー「AIファクトリー」の構想を公式ブログで発表しました。産業革命期の発電所がエネルギー電力に変えたように、AIファクトリーはエネルギーをトークンに変換し、推論モデルエージェントに知能を供給する施設と位置づけています。その経済性は、秒間トークン数・ワットあたりトークン数・トークン単価・稼働率で測定されます。

性能面では、NVIDIA GB300 NVL72システムがメガワットあたりのトークン生成量で前世代Hopperの50倍を達成し、トークン単価を35分の1に削減したとしています。推論ワークロードをリアルタイムで効率的にさばくため、Dynamoフレームワークがロングコンテキスト推論と大規模スループットを統合管理します。次世代のVera Rubinプラットフォームは、LPXアーキテクチャにより性能電力比をさらに最大35倍に引き上げる設計です。

こうしたAIファクトリーはフルスタックで最適化されます。GPU・CPU・高速ネットワーク・液冷システム・推論ソフトウェア・ストレージが一体設計され、自律型マルチエージェントが常時稼働するワークロードを処理します。エージェント推論・計画・コード生成・ツール利用を自律的に行い、さらにサブエージェントを生成して専門スキルを獲得するため、推論負荷は従来よりはるかに大きくなっています。

NVIDIA DSXリファレンス設計は、ギガワット級のAIファクトリーを標準化するもので、設計・シミュレーション・運用をOmniverse DSX Blueprintのデジタルツインで統合します。Cisco、Dell、HPE、Lenovo、Supermicroといったパートナー企業と協力し、企業データセンターへの導入を推進しています。NVIDIA自身も社内AIファクトリーを運用し、数百の自律AIエージェントエンジニアリングや業務を支援している実例を示しています。

NVIDIA創業者兼CEOであるジェンスン・ファン氏は、6月1日のCOMPUTEX併催GTC Taipeiで基調講演を行う予定です。AIファクトリーは金融・ライフサイエンス・製造・公共部門などあらゆる産業が「構築するか借りるか」を問われる時代の基盤インフラだと、NVIDIAは訴えています。