GoogleがGemini 3 Flashにエージェント型ビジョン機能を追加

Agentic Visionの特徴

視覚情報のエージェント活用
Gemini 3 Flashへの組み込み
マルチモーダルエージェント

応用可能性

画像を見ながらのタスク実行
UI操作の自動化
視覚的ワークフロー対応
詳細を読む

GoogleGemini 3 FlashにAgentic Vision機能を導入しました。AIエージェントが視覚情報を理解しながらタスクを実行できるマルチモーダルエージェント機能です。

画面のスクリーンショットを見ながらUIを操作するなど、視覚的ワークフローの自動化が可能になり、RPA分野への AI展開が加速します。