OpenAI、開発者向けAPIを大幅強化:GPT-5 ProとSora 2提供開始

基盤モデルマルチモーダルインフラ

フラッグシップモデルの進化

GPT-5 ProをAPI経由で提供開始
金融、法律など高精度な推論を要求する業界向け
動画生成モデルSora 2のAPIプレビュー公開
リアルなシーンと同期したサウンドの生成

低遅延音声AIの普及戦略

小型で安価な音声モデルgpt-realtime miniを導入
低遅延ストリーミングによる高速な音声対話を実現
旧モデル比でコストを70%削減し低価格化
詳細を読む

OpenAIは先日のDev Dayにおいて、開発者向けAPIの大規模な機能強化を発表しました。特に注目すべきは、最新の言語モデル「GPT-5 Pro」、動画生成モデル「Sora 2」のAPIプレビュー公開、そして小型かつ安価な音声モデル「gpt-realtime mini」の導入です。これはAIエコシステムへの開発者誘致を加速させ、高精度なAI活用を目指す企業に新たな機会を提供します。

最新のフラッグシップモデルであるGPT-5 Proは、高い精度と深い推論能力を特徴としています。CEOのサム・アルトマン氏は、このモデルが金融、法律、医療といった、特に正確性が要求される業界のアプリケーション開発に有効だと強調しました。これにより、複雑な専門的タスクの自動化と品質向上が期待されます。

また、大きな話題を呼んだ動画生成モデルSora 2も、開発者エコシステム参加者向けにAPIプレビューが開始されました。開発者はSora 2の驚異的な動画出力能力を自身のアプリケーションに直接組み込めます。より現実的で物理的に一貫したシーン、詳細なカメラディレクション、そして視覚と同期した豊かなサウンドスケープの生成が可能です。

さらに、今後のAIとの主要な対話手段として重要視される音声機能強化のため、新モデル「gpt-realtime mini」が導入されました。このモデルは、APIを通じて低遅延のストリーミング対話に対応しており、応答速度が極めて重要なアプリケーション開発を可能にします。

gpt-realtime miniの最大の特徴は、そのコストパフォーマンスの高さです。従来の高度な音声モデルと同等の品質と表現力を維持しながら、利用コストを約70%も削減することに成功しました。この大幅な低価格化は、音声AI機能の普及を加速させ、より多くの企業が手軽にAIを活用できる環境を整えます。