Hugging Face、仏Scalewayを推論プロバイダーに統合しAI利用の選択肢拡大

2025年09月17日 Qwen ワークフロー gpt-oss エンジニア経営者推論

統合の核心と利点

Scalewayを新たな推論プロバイダーに追加。

gpt-ossやQwen3など人気モデルへ容易にアクセス。

モデルページからサーバーレスで即時推論可能。

ウェブUIとクライアントSDKからシームレス利用。

Scalewayの技術的強み

欧州データセンターによるデータ主権と低遅延。

トークンあたり€0.20からの競争的価格。

構造化出力、ファンクションコーリングに対応。

高速応答（200ms未満）を実現。

柔軟な課金体系

カスタムキー利用でプロバイダーに直接請求。

HF経由の請求は追加マークアップなし。

PROユーザーは毎月2ドル分の推論クレジット付与。

出典：Hugging Face

詳細を読む

Hugging Faceは、フランスのクラウドプロバイダーであるScalewayを新たな「Inference Provider（推論プロバイダー）」としてハブに統合しました。これにより、経営者やエンジニアはgpt-ossやQwen3などの人気オープンウェイトモデルを、Scalewayの提供するフルマネージドなサーバーレス環境で利用可能になります。この統合は、AIモデルのデプロイと利用の柔軟性を高め、特に欧州におけるデータ主権への要求に応えるものです。

Scalewayが提供するのは「Generative APIs」と呼ばれるサーバーレスサービスであり、トークンあたり0.20ユーロ/100万トークンからという競争力のある従量課金制が特徴です。ユーザーはシンプルなAPIコールを通じて、最先端のAIモデルにアクセスできます。この手軽さとコスト効率は、大規模な本番環境での利用を検討する企業にとって大きなメリットとなります。

インフラストラクチャはパリの欧州データセンターに置かれており、欧州の利用者に対してデータ主権の確保と低遅延の推論環境を提供します。応答速度はファーストトークンで200ミリ秒未満を達成しており、インタラクティブなアプリケーションやエージェントワークフローへの適用に最適です。テキスト生成とエンベディングモデルの両方をサポートしています。

Scalewayのプラットフォームは高度な機能にも対応しています。具体的には、応答形式を指定できる構造化出力や、外部ツール連携を可能にするファンクションコーリング、さらにマルチモーダル処理能力を備えています。これにより、より複雑で実用的なAIアプリケーションの開発が可能になります。

利用者は、HFのウェブサイトUIだけでなく、PythonやJavaScriptのクライアントSDKからシームレスに推論を実行できます。課金方式は二通りあり、ScalewayのAPIキーを使う場合は直接プロバイダーに請求されます。HF経由でルーティングする場合は、HFによる追加のマークアップは発生しないため、透明性が高い価格で利用できます。

Hugging FaceのPROプランユーザーには、毎月2ドル分の推論クレジットが特典として提供されます。このクレジットは、Scalewayを含む複数のプロバイダーで横断的に使用可能です。本格的な商用利用や高いリミットが必要な場合は、PROプランへのアップグレードが推奨されています。