Google検索が画像内の複数物体を同時識別する新機能を搭載

視覚検索の進化

Circle to Searchが複数物体同時検索に対応
Geminiがマルチモーダル解析を担当
画像内の各アイテムを自動識別・分類
テキスト検索からの視覚検索も可能

ファンアウト技術

1回の検索十数件の並列検索を実行
複数結果を統合し一つの回答として提示
ショッピング以外に美術館や植物にも応用
ウェブ結果を活用し次のステップも提案
詳細を読む

Googleは、Android向けのCircle to SearchおよびLensにおいて、1枚の画像から複数のオブジェクトを同時に識別・検索できる大型アップデートを実施しました。従来は1アイテムずつしか検索できなかった制約が解消されています。

この技術の中核を担うのがGeminiモデルです。画像とユーザーの質問を同時に解析し、どのツールを使うべきかを判断します。たとえばSNSで見かけたコーディネートを検索すると、帽子・靴・ジャケットそれぞれの画像検索結果を一つにまとめて表示します。

Googleが「ファンアウト」と呼ぶ技術では、1回の操作で十数件の検索を並列実行します。AIモデルが画像内の各要素を理解し、複数の検索クエリを同時に発行して結果を統合することで、数秒以内に包括的な回答を生成します。

活用範囲はショッピングにとどまりません。美術館の壁に並ぶ絵画の解説を一括で求めたり、庭の植物の手入れ方法をまとめて調べたりと、「この一つは何か」から「このシーン全体を説明して」への転換を実現しています。

テキスト検索から始めることも可能です。AI Modeで「仕事用コーディネートのインスピレーション」と入力し、気に入った結果の画像を指定すれば、そこからファンアウト検索が開始されます。視覚と言語の垣根を超えた検索体験が広がっています。