Googleが高速安価な画像・動画生成2モデル公開
詳細を読む
Googleは6月30日、画像生成モデル「Nano Banana 2 Lite」と動画生成モデル「Gemini Omni Flash」を開発者向けに公開しました。前者は約4秒で1K解像度の画像を生成し、料金は1,000枚あたり0.034ドルと同社で最も安価です。後者は会話形式で動画を編集できる新機能を備え、両モデルとも本日からGoogle AI StudioやGemini apiを通じて利用できます。
Nano Banana 2 Liteは「Gemini 3.1 Flash-Lite Image」が正式名称で、速度とコストを最優先する高頻度の制作現場に向けた割り切った設計です。標準版が約20秒かかる画像生成を約4秒に短縮し、料金も標準のNano Banana 2の半額に抑えました。広告のA/Bテストや多言語の店舗ページ作成など、大量生成を繰り返す業務での採用を想定しています。
ただし速度と引き換えに制約もあります。解像度は1Kのみで、上位モデルが対応する2Kや4Kは選べません。Googleは小さな文字やインフォグラフィックの正確さ、人物の一貫性が下位の品質になりやすいと明示しており、用途を見極めた使い分けが必要です。
もう一方のGemini Omni Flashは、完成した動画を自然言語の指示で編集できる点が特徴です。台本用のLLM、画像生成、動画化、口の動きの同期、音声生成と五つに分かれていた工程を一つのモデルに統合し、契約や課金、データ管理の手間を減らします。料金は720p動画で1秒あたり0.10ドルで、10秒の動画がおよそ1ドルです。
品質面でも評価は高く、利用者が出力を比較投票するLMArenaの動画部門で首位を獲得しました。一方で動画は10秒までという上限があり、長い動画は分割して結合する必要があります。静止画と音声から人物に話させる機能は偽造防止のためあえて非対応とし、全出力にSynthID透かしとC2PAの来歴情報を埋め込んでいます。
両モデルは組み合わせて使う設計です。Nano Banana 2 Liteで素早く画像を作り、それをOmni Flashに渡して動画化する流れを、状態を保持するInteractions apiが支えます。Googleは安価な料金で開発者を自社基盤に囲い込む狙いを鮮明にしており、生成メディア市場での競争はいっそう激しくなりそうです。