DeepInfraがHugging Face推論プロバイダーに参加

統合の概要

サーバーレス推論基盤として統合
100超のモデルを低コストで提供
会話・テキスト生成タスクに対応

対応モデルと利用法

DeepSeek V4やKimi-K2.6等に対応
Python・JS両SDKから利用可能
HF経由ルーティングで追加料金なし

今後の展開

画像動画生成等も順次対応予定
PROユーザーに月2ドル分のクレジット
詳細を読む

DeepInfraが、Hugging Face Hubの推論プロバイダーとして新たに統合されました。DeepInfraは業界でも最も低コストなトークン単価を誇るサーバーレスAI推論プラットフォームで、100以上のモデルカタログを持ち、開発者が最小限のセットアップでAI機能をアプリケーションに組み込めます。

今回の初期統合では、会話およびテキスト生成タスクをサポートしています。DeepSeek V4Kimi-K2.6、GLM-5.1など人気のオープンウェイトLLMにアクセスできるようになりました。テキストから画像動画への生成やエンベディングなど、追加タスクへの対応も順次展開される予定です。

利用方法は2つあります。ユーザーが自身のDeepInfra APIキーを設定して直接リクエストを送る方法と、Hugging Face経由でルーティングする方法です。後者の場合、プロバイダーのトークンは不要で、標準的なプロバイダー料金のみが課金されます。Hugging Face側の追加マークアップはありません。

SDKとの統合も進んでおり、Pythonのhuggingface_hubやJavaScriptの@huggingface/inferenceから簡単に利用できます。さらにPi、OpenCode、Hermes Agentsなど主要なエージェントハーネスにも統合済みで、追加のコードなしでDeepInfraホストモデルを活用可能です。PROプランのユーザーには毎月2ドル分の推論クレジットが付与され、複数プロバイダーにまたがって利用できます。