NVIDIAとAWSが本番AI基盤を拡張、推論4.6倍に

GPUインスタンス

EC2 G7を新たに提供
Blackwell世代GPU搭載
推論性能は最大4.6倍
最大8GPU構成に対応

検索と学習の強化

ベクトル検索標準GPU
索引は最大10倍高速・コスト4分の1
GB300で性能認定取得
詳細を読む

NVIDIAは6月24日、米AWSと連携し、本番規模のAI基盤を強化すると発表しました。両社はクラウド上の計算、検索、学習の各層を一体で改良し、企業が運用負担を抑えながらAIを実運用へ移せる環境を整えます。低遅延の推論や高速なベクトル検索GPUの価格性能比といった課題に同時に対応する狙いです。

中核となるのが新インスタンスAmazon EC2 G7」です。NVIDIAのRTX PRO 4500 Blackwell Server Edition GPUを搭載し、AI推論や映像処理、データ分析などの本番ワークロードに対応します。従来のG6と比べ、推論性能は最大4.6倍、グラフィックス性能は最大2.1倍に高まりました。

G7は最大8基のGPUと合計256GBのGPUメモリ、700Gbpsのネットワーク、最大7.6TBのローカルSSDを備えます。1基から8基までの構成に加え、ベアメタルも近く提供される予定です。利用者は過剰な設備投資を避け、用途に合わせて規模を最適化できる点が特徴です。

検索の層では、NVIDIAのライブラリ「cuVS」を使い、GPUによるベクトル索引をOpenSearch Serverlessの標準とします。これにより索引作成はCPU構成と比べて最大10倍速く、コストは4分の1に下がり、数十億規模のベクトルデータベースを1時間以内で構築できるとしています。検索拡張生成(RAG)や意味検索エージェント型AIの基盤づくりが容易になります。

学習の層では、AWSNVIDIA GB300向けに「Exemplar Cloud」認定を取得しました。NVIDIAが定める性能基準を満たしたことを示すもので、両社の協業による成果です。開発者は一貫した高性能基盤を前提に学習を進められ、クラウド選定や総保有コストの判断がしやすくなります。

今回の発表は、計算・検索・学習というAI基盤の全層を同時に底上げする内容です。共通する狙いは、運用チームの負担を増やさずに本番規模で性能を発揮できる環境を提供することにあります。企業がAIを計画段階から実運用へ移す動きが、さらに加速しそうです。