NvidiaがNemotron 3公開とSchedMD買収で事業拡大

Nemotron 3の特徴と技術革新

ハイブリッドMoEアーキテクチャを採用
Nano・Super・Ultraの3サイズ展開
100万トークンコンテキスト長対応
前世代比最大4倍のトークンスループット向上
学習レシピとデータセットを完全オープン公開
強化学習基盤NeMo Gymを同時リリース
Accentureら大手企業がアーリーアダプターとして参加

SchedMD買収とH200中国展開

HPC向けジョブスケジューラSlurmの開発元を買収
Slurmはオープンソースとして継続提供
H200チップ中国向け輸出が米政府承認
中国大手企業から大規模発注が殺到
H200の追加生産拡大を検討中
中国政府の輸入可否判断が今後の焦点
詳細を読む

NvidiaはNemotron 3モデルファミリーを公開しました。Nano(300億パラメータ)、Super(1000億)、Ultra(5000億)の3サイズで構成され、ハイブリッドMamba-TransformerのMoEアーキテクチャを採用しています。

Nemotron 3 Nanoは同規模モデルと比較して最大3.3倍のスループットを実現し、100万トークンのコンテキストウィンドウに対応します。推論コストの削減と精度向上を両立した設計です。

Nvidiaはモデルの重み、学習レシピ、事前学習事後学習データセットをすべて公開しています。公開された事後学習データセットは既存の最大規模のものより2.5倍大きく、業界最大規模となります。

モデル訓練に使用した強化学習基盤NeMo Gymもオープンソースとして公開されました。数学コーディング、ツール利用など10以上のRL環境が含まれており、開発者が独自環境を構築することも可能です。

Nvidiaはと同日、HPC向けオープンソースのワークロード管理システムSlurmを開発するSchedMDの買収を発表しました。Slurmは世界のスーパーコンピュータTop500のうち半数以上で採用されている実績ある基盤ソフトウェアです。

SchedMD買収によりNvidia半導体からモデル、そしてHPCソフトウェアスタックまでをカバーする垂直統合を強化します。SlurmはNvidiaハードウェア上での最適化が進む一方、ベンダー中立性も維持されます。

米政府はNvidiaのH200チップ中国へ輸出することを承認しました。H200は前世代Hopperシリーズの最高性能GPUで、中国ではこれまで販売が制限されていました。

承認を受けてAlibabaやByteDanceなど中国大手企業がH200の大口注文を検討しており、Nvidiaは需要に応えるため生産拡大を検討しています。ただし中国政府側の輸入許可判断が依然として焦点です。

一方でNvidiaにとってのリスクも存在します。中国政府は国産チップの活用を推進しており、長期的には中国AIモデルが自国製シリコンに依存する方向へシフトする可能性があります。