GoogleがGemini 3 Flashにエージェント型ビジョン機能を追加

2026年01月27日 Google Gemini ワークフロー画像エージェント

Agentic Visionの特徴

視覚情報のエージェント活用

Gemini 3 Flashへの組み込み

マルチモーダルエージェント化

画像を見ながらのタスク実行

UI操作の自動化

詳細を読む

GoogleはGemini 3 FlashにAgentic Vision機能を導入しました。AIエージェントが視覚情報を理解しながらタスクを実行できるマルチモーダルエージェント機能です。

画面のスクリーンショットを見ながらUIを操作するなど、視覚的なワークフローの自動化が可能になり、RPA分野への AI展開が加速します。