Google I/Oで動画生成AI Gemini Omni発表

新モデルの全容

Gemini Omni動画の会話編集に対応
Gemini 3.5 Flashがエージェント性能で最前線に
Gemini appとAI Mode in Searchの標準モデルに採用
開発基盤Antigravityとの統合で複雑タスク実行

個人向けエージェントSpark

Gmail・カレンダー等と連携し24時間稼働
個人データから高精度な提案を自動生成
AI Ultra加入者向けに米国で提供開始

提供と課題

Omni FlashはYouTube Shortsでも無料利用可能
詳細を読む

Googleは2026年5月の開発者会議Google I/O 2026で、3つの主要AI製品を発表しました。マルチモーダル動画生成モデル「Gemini Omni」、エージェント向け最新モデル「Gemini 3.5 Flash」、そして常時稼働型パーソナルAIエージェントGemini Spark」です。いずれもGoogleエージェント実行基盤Antigravityと統合されています。

Gemini Omniは画像音声動画・テキストを入力として高品質な動画を生成・編集できるモデルです。自然言語で動画を会話的に編集でき、前のターンの指示を引き継ぎながらキャラクターの一貫性や物理法則を保つ点が特徴です。Gemini app、Google FlowYouTube Shorts等で順次提供されます。

Gemini 3.5 Flashはエージェントタスクとコーディングに特化した最新モデルで、大規模フラッグシップモデルに匹敵する性能をFlashシリーズの速度で実現します。Gemini appの標準モデルおよびGoogle検索のAI Modeに採用され、検索結果をリアルタイムにカスタムUIとして生成する機能や、情報エージェントによるバックグラウンド監視機能が導入されます。

Gemini SparkはGemini 3.5とAntigravityを基盤とするパーソナルAIエージェントで、GmailGoogleカレンダー等のWorkspaceツールと連携して日常タスクを自動化します。WIREDの実機レビューでは、メールやカレンダーから誕生日パーティーの計画を自動生成するなど高い情報統合力を示しました。一方で、同居のパートナーを「親しい友人」と分類するなど文脈理解の限界も露呈しています。

セキュリティ面では、個人データへの広範なアクセスに伴うプロンプトインジェクション攻撃のリスクGoogle自身が警告しています。Sparkは月額100ドルのAI Ultraプランの加入者向けに米国で提供が始まりました。Gemini 3.5 FlashのAPIはGoogle AI StudioやAndroid Studio等で一般提供されています。