NVIDIA新基盤、最先端AIの推論速度と収益性を10倍へ

2025年12月03日 NVIDIA DeepSeek 生産性エンジニア専門家経営者

最先端AIの標準「MoE」

脳のように専門領域を分担し効率化

トップモデルの60%以上が採用

拡張を阻む「壁」を突破

従来のGPU連携では通信遅延が課題

72基のGPUを単一巨大化し解決

10倍の性能が拓く未来

電力対性能とトークン収益が10倍に

エージェント型AIの基盤としても最適

出典：NVIDIA公式

詳細を読む

NVIDIAは3日、同社の最新システム「Blackwell NVL72」が、現在主流のAIアーキテクチャ「MoE（Mixture of Experts）」の推論性能を前世代比で10倍に高めると発表しました。DeepSeekやMistralなどの最先端モデルにおいて、劇的な処理速度と電力効率の向上を実現し、AI運用の経済性を根本から変革します。

なぜ今、MoEが重要なのでしょうか。人間の脳の仕組みを模したこの技術は、タスクに応じて特定の「専門家（エキスパート）」パラメータのみを稼働させます。計算リソースを抑えつつ高度な知能を実現できるため、オープンソースのトップモデルの多くが採用していますが、その複雑さゆえに、従来のハードウェアでは大規模な展開が困難でした。

この課題に対し、NVIDIAは「Extreme Codesign」で応えました。NVL72システムは、最大72基のGPUを高速なNVLinkで結合し、あたかも「一つの巨大なGPU」として動作させます。これにより、メモリ帯域と通信遅延のボトルネックを解消し、大規模なMoEモデルを効率的に分散処理することが可能になりました。

その効果は絶大です。Kimi K2 ThinkingやMistral Large 3といったモデルでは、前世代のH200と比較して10倍のパフォーマンスを記録しました。これは単なる速度向上にとどまらず、電力あたりの生成能力、ひいてはトークン収益の10倍増を意味し、データセンターの収益構造を劇的に改善します。

さらに、このアーキテクチャは次世代の「エージェント型AI」にも最適です。複数の特化型AIが協調して動く未来のシステムは、本質的にMoEと同じ構造を持つからです。経営者やエンジニアにとって、この新基盤への移行は、AIの生産性と市場競争力を高めるための必須条件となるでしょう。