NVIDIAのBlackwell、AI工場を駆動する新プラットフォーム

インフラ導入事例NVIDIA
詳細を読む

NVIDIAは最新アーキテクチャ「Blackwell」を、単なる半導体チップではなく「AI工場」を駆動するプラットフォームだと説明します。次世代AIモデルはパラメータ数が1兆を超えると予測され、膨大な計算需要が生まれています。Blackwellはこうした需要に応えるべく、システム全体で性能を追求する設計思想に基づいています。

その中核がラック規模システム「NVIDIA GB200 NVL72」です。これは単一の巨大GPUとして動作するよう設計され、AI推論の効率を劇的に高めます。重さ1.5トンのラックに60万以上の部品と約3.2kmの配線が詰め込まれ、ハードウェアとソフトウェアが密に統合されています。

性能の源泉は、2つのBlackwell GPUと1つのGrace CPUを統合した「Grace Blackwellスーパーチップ」です。高速インターコネクト技術「NVIDIA NVLink」で直結し、CPUとGPUがメモリを直接共有します。これによりAIワークロードの遅延を減らし、スループットを高めます。

GB200 NVL72内では「NVLink Switch」が性能ボトルネックを防ぎます。5,000本以上の銅線ケーブルが72基のGPUを網の目のように接続。毎秒130テラバイトという驚異的な速度でデータを移動させます。これはインターネット全体のピーク時トラフィックを1秒未満で転送できる速度に匹敵します。

AI工場では数万台のGB200 NVL72が一体で機能する必要があります。これを「Spectrum-X Ethernet」や「Quantum-X800 InfiniBand」といったネットワーク技術が実現。データセンターレベルでの統一的な動作を可能にし、全GPUが工場内のデータネットワークへ直接接続される仕組みを構築します。

データセンターという巨大なコンピュータを動かすOSが「NVIDIA Dynamo」です。多数のGPUにまたがるAI推論リクエストを調整・最適化し、需要に応じてGPUリソースを動的に割り当てます。これにより工場全体の生産性と収益性を最大化し、運用コストを低減します。

Blackwellはもはや単なるチップではなく、次世代の産業革命を支えるAI工場のエンジンです。すでに世界最大級のコンピューティングクラスターがこのアーキテクチャを基盤に構築されており、AIによるイノベーションをさらに加速させていくことが期待されます。