推論特化の新興General Computeが1500万ドル調達

推論特化チップへの賭け

SambaNovaのSN50チップを3億ドル分発注
GPUの約2.5倍、毎秒600〜700トークン生成
空冷・低消費電力で既存施設に設置可能
暗号資産マイナーの施設転用も視野

推論クラウド市場の構造変化

NVIDIAGroq買収Cerebras上場が示す潮流
複数モデル・エージェント時代の速度競争
コーディング作業を数時間から数分に短縮
SambaNova側もGeneral Computeに賭ける相互依存
詳細を読む

AI推論に特化した新興ネオクラウド企業General Computeが、FUSE VC主導のシードラウンドで1500万ドル(ポストマネーバリュエーション6000万ドル)を調達しました。同社はAIモデルの学習ではなく推論、つまりモデルが実際にユーザーの問いに応答する処理に特化したクラウドサービスを提供します。CEOのFinn Puklowski氏とCTOのJason Goodison氏が共同創業しました。

注目すべきは同社のチップ戦略です。GPU需要が急増する一方で、推論フェーズにはGPUが最適ではないという認識が業界で広がっています。NVIDIAによるGroqの200億ドル買収Cerebrasの570億ドル規模IPOがその潮流を象徴しています。General Computeは、Intel出資のSambaNovaが開発する推論特化チップSN50を採用し、3億ドル相当を発注済みです。

SambaNova新チップの性能は毎秒600〜700トークンの生成速度を見込んでおり、GPUの約250トークンを大きく上回ります。さらに空冷方式で消費電力も低いため、水冷設備や大規模な電力インフラの新規投資なしに既存データセンターへ導入できます。暗号資産マイニング施設の転用によるコロケーション展開も計画しています。

投資家のJoe Hasselmann氏は、SambaNova とGeneral Computeの関係をNVIDIAとCoreWeaveの関係になぞらえます。推論クラウドは、単一プロバイダーが支配しない複数モデル・複数エージェントの世界を前提とした事業モデルです。OpenRouterが今週1億1300万ドルのシリーズBを調達したことも、この市場の成長を裏付けています。

Puklowski氏はコーディングエージェントの処理時間を数時間から5〜10分へ短縮し、音声カスタマーサービス推論コストを下げることを目指しています。エージェント同士が高速に通信する時代において、推論速度とコスト効率が競争力の鍵になるとの見方を示しました。