Beatingによると、Google Gemini 3.1 Flash-Liteはプレビューから一般提供(GA)に移行し、5月8日にリリースされ、Gemini 3シリーズで最も安く最速のモデルになりました。入力の料金はトークン100万枚あたり$0.25、出力はトークン100万枚あたり$1.50に設定されています。入力コストはClaude 4.5 Haiku($1.00)より75%安く、出力コストは70%安いです($5.00)。このモデルはコンテキストウィンドウが100万トークンで、363トークン/秒のスループットを実現しており、前身のGemini 2.5 Flashより45%高速です。
性能ベンチマークでは、GPQA Diamond(大学院レベルの科学的推論)が86.9%となり、Claude 4.5 Haikuの73.0%やGPT-5 miniの82.3%を上回りました。MMMU-Pro(マルチモーダル推論)は76.8%に達しています。初期導入者には、顧客対応プラットフォームGladlyが含まれ、制作(本番)ワークロードでコストを60%削減し、成功率が99.6%だと報告しています。またJetBrainsは、Flash-LiteをIDE支援ツールに統合しています。