NVIDIA新GPU、AI学習ベンチマークで全制覇

Blackwell Ultraの圧倒的性能

MLPerf全7部門を完全制覇
LLM学習でHopper比4倍以上の性能
Llama 3.1 405Bをわずか10分で学習
唯一全テストに結果を提出した企業

新技術が支える記録更新

史上初のNVFP4精度での計算を導入
GB300 NVL72システムが初登場
画像生成モデルでも最高性能を記録
広範なパートナーエコシステムを証明
@gosrumのXポスト: 私がllama-benchで実測した値です。ご参考までに。 すべてMXFP4です。 ・M2Ultra:65-80 ・M3 Ultra:70-85 ・Ryzen AI MAX+:40-50 ・RTX PRO 6000:150-190 ※右側の値はコンテキスト長が短い場合の最大 ど…
詳細を読む

NVIDIAは、AIの性能を測る業界標準ベンチマーク「MLPerf Training v5.1」において、新GPUアーキテクチャ「Blackwell Ultra」を搭載したシステムで全7部門を制覇し、大規模言語モデル(LLM)の学習速度で新記録を樹立しました。この結果は、同社の技術的優位性とプラットフォームの成熟度を改めて示すものです。

今回初登場したBlackwell Ultra搭載の「GB300 NVL72」システムは、前世代のHopperアーキテクチャと比較して、同数のGPUでLLMの事前学習性能が4倍以上に向上しました。新しいTensor Coreや大容量メモリが、この飛躍的な性能向上を支えています。

性能向上の鍵は、MLPerf史上初となるNVFP4精度での計算です。より少ないビット数でデータを表現し、計算速度を大幅に高める新技術を導入。NVIDIAは、精度を維持しながらこの低精度計算を実用化した唯一の企業となりました。

大規模な学習においても新記録を達成しました。5,000基以上のBlackwell GPUを連携させることで、大規模モデル「Llama 3.1 405B」の学習をわずか10分で完了。これは、NVFP4の採用とスケーリング効率の向上による成果です。

今回から追加された新しいベンチマーク、軽量LLM「Llama 3.1 8B」と画像生成モデル「FLUX.1」でも、NVIDIA最高性能を記録しました。これは、同社のプラットフォームが最新の多様なAIモデルに迅速に対応できる汎用性の高さを示しています。

DellやHPEなど15のパートナー企業もNVIDIAプラットフォームで参加し、広範なエコシステムを証明しました。NVIDIA1年周期で革新を続けており、AI開発のさらなる加速が期待されます。AI導入を目指す企業にとって、その動向はますます重要になるでしょう。