MSがFireworks AIとAzure基盤で提携、オープンモデル推論を強化

統合の概要

Microsoft Foundry上で提供開始

DeepSeek V3.2など4モデル対応

毎日13兆トークン処理の実績

秒間18万リクエストの高速推論

サーバーレスと固定スループットの選択制

独自学習済み重みの持ち込み対応

Azure水準のガバナンスと監視機能

エージェント開発・評価の統合環境

詳細を読む

Microsoftは、AI統合基盤「Microsoft Foundry」上でFireworks AIのオープンモデル推論サービスのパブリックプレビューを開始したと発表しました。企業がオープンモデルを本番環境で安全かつ効率的に運用できる体制を整えます。

Fireworks AIは業界トップクラスの推論性能を誇り、毎日13兆トークンを処理し、秒間約18万リクエストを捌く実績があります。大規模モデルでも毎秒1,000トークン以上の生成速度を実現しており、この性能がAzure上で利用可能になります。

対応モデルはDeepSeek V3.2、OpenAI gpt-oss-120b、Kimi K2.5、新規追加のMiniMax M2.5の4種類です。サーバーレスの従量課金と、安定稼働向けのプロビジョンドスループットユニットの2つの料金体系から選択できます。

企業向けには独自のファインチューニング済みモデルをアップロードして推論に使える「BYOW」機能を提供します。既存の推論スタックを変更せずにカスタムモデルを登録・運用でき、実験から本番移行までの障壁を大幅に下げます。

Microsoft Foundryはモデル評価からデプロイ、ガバナンス、監視までを一元管理するエンタープライズ制御基盤として設計されています。オープンモデルの採用拡大に伴い、ツールやインフラの分断を防ぎ、継続的な改善サイクルを支える統合プラットフォームとして位置づけられています。