Google、インタラクティブ世界を生成するProject Genieを公開

Project Genieの概要

テキストや画像から仮想世界を生成
リアルタイムで探索・操作が可能
米国AI Ultra加入者向けに提供開始

効果的な活用法

環境の詳細な描写が品質向上の鍵
キャラクターの動作や外見を自由に設定
自分の画像アップロードで世界を構築
一人称・三人称視点の切り替えに対応
詳細を読む

Google DeepMindは、テキストや画像プロンプトからインタラクティブな仮想世界を生成できる実験的プロトタイプ「Project Genie」を公開しました。現在、米国の18歳以上のGoogle AI Ultra加入者が利用可能です。

ユーザーは森林や都市、月面など自由に環境を設計できます。天候や雰囲気、フォトリアルかカートーン風かなどのスタイル指定も可能で、具体的な描写を加えるほど生成される世界の品質が向上します。

世界を探索するためのキャラクター設定も柔軟です。小さな青いキリンや巨大なピクセルドールなど自由に作成でき、移動方法や視覚エフェクトも細かく指定できます。テキストだけでなく自分の画像をアップロードして世界を構築することも可能です。

プロンプトには短く具体的な指示が効果的です。「サンゴの多い海中シーン」のような直接的な表現が推奨されており、Geminiアプリでプロンプト作成の支援を受けることもできます。Nano Banana Proによるプレビュー機能で、探索前に世界の見た目を確認・調整できます。

探索時には一人称視点と三人称視点を切り替えられます。キャラクターの目線で世界を体験するか、上空からキャラクターを見下ろすかを選択でき、ボタン一つで視点変更が可能です。今後、提供地域の拡大も予定されています。