Google、Gemini新基盤APIを正式提供開始
主な新機能
詳細を読む
米Googleは6月22日、Geminiモデルとエージェントを操作する新基盤「Interactions API」が一般提供(GA)に到達したと発表しました。2025年12月の公開ベータを経て、同社はこれをGemini向けの主要APIと位置づけ、すべての公式ドキュメントの既定をこの新APIへ切り替えます。開発者が最も好む構築手段に急速に定着したと説明しています。
GA版ではスキーマが安定したほか、開発者の要望に応える主要機能が加わりました。目玉はManaged Agentsで、1回のAPI呼び出しで遠隔のLinuxサンドボックスを確保し、エージェントが推論・コード実行・Web閲覧・ファイル管理をこなします。既定エージェントとして「Antigravity」が提供され、独自エージェントの定義も可能です。
実行面では、呼び出しに「background=True」を指定すれば、サーバー側が処理を非同期で走らせます。長時間タスクを扱いやすくする設計です。ツールも強化され、Google検索やGoogleマップといった組み込み機能と自作関数を1つの要求内で混在させ、結果を画像付きで返せるようになりました。
メディア生成も拡充しました。画像生成はNano Banana 2、音楽はLyria 3、表現力のある音声は複数話者TTSに対応します。Deep Researchも、速度重視と深さ重視の2系統やネイティブな図表生成を追加しました。スキーマは従来の「役割(Roles)」構造から、各動作を型付きの「ステップ(Steps)」として扱う方式へ簡素化されています。
費用と運用の最適化も進みました。FlexとPriorityの階層により費用か遅延かを選べ、Flexでは費用を50%削減できます。過去のやり取りは有料枠で55日間保持され、後から取得可能です。一方、従来の「generateContent」APIも完全にサポートを継続し、当面は新しいGeminiモデルを受け取り続けます。
ただしGoogleは、長時間稼働モデルやエージェント向けの最先端機能は、状態を持つエージェント処理向けに設計された新APIへ集約していくとの見通しを示しました。新APIはPythonとJavaScriptのSDKで利用でき、LiteLLMなどの提携先経由でも使えます。移行ガイドも公開され、各フィールドの対応関係を確認しながら段階的に切り替えられます。