Google、最速・最安のGemini 3.1 Flash-Liteを公開
詳細を読む
Googleは2026年3月3日、Gemini 3シリーズで最も高速かつ低コストなモデル「Gemini 3.1 Flash-Lite」のプレビュー版を公開しました。大量処理を必要とする開発者向けに設計され、Google AI StudioとVertex AIから利用できます。
速度面では前世代のGemini 2.5 Flashと比較して初回トークン生成が2.5倍高速化し、出力速度も45%向上して毎秒363トークンを実現しています。この低遅延により、リアルタイムのカスタマーサポートやコンテンツモデレーションなど即応性が求められる用途に最適です。
ベンチマーク性能も軽量モデルとしては突出しており、Arena.aiのEloスコア1432、GPQA Diamondで86.9%、MMMU Proで76.8%を記録しました。LiveCodeBenchでも72.0%を達成し、より大規模なモデルに匹敵する推論能力とマルチモーダル理解力を示しています。
価格は入力100万トークンあたり0.25ドル、出力100万トークンあたり1.50ドルに設定されています。競合のClaude 4.5 Haiku(入力1.00ドル)やGPT-5 mini等と比べて大幅に安く、上位モデルGemini 3.1 Proの約8分の1のコストで利用可能です。
新機能として思考レベル(minimal/low/medium/high)が導入され、タスクの複雑さに応じて推論の深さを動的に切り替えられます。単純な分類は最速モードで処理し、ダッシュボード生成やシミュレーション作成には高度な推論を適用する柔軟な運用が可能です。
早期アクセス企業からは高い評価が寄せられています。Latitude社は成功率20%向上と推論速度60%改善を報告し、Whering社はアイテムタグ付けで100%の一貫性を達成しました。HubX社は構造化出力の準拠率97%と10秒未満の応答を確認しています。