За Beating, Google Gemini 3.1 Flash-Lite перейшов з режиму попереднього доступу до загальної доступності (GA) 8 травня, ставши найдешевшою та найшвидшою моделлю в лінійці Gemini 3. Вартість введення встановлено на рівні $0,25 за мільйон токенів, а виведення — $1,50 за мільйон токенів: витрати на введення на 75% нижчі, ніж у Claude 4.5 Haiku ($1,00), а на виведення — на 70% нижчі ($5,00). Модель має контекстне вікно на 1 мільйон токенів і досягає пропускної здатності 363 токени за секунду — на 45% швидше, ніж попередник Gemini 2.5 Flash.
Бенчмарки продуктивності показують GPQA Diamond (розуміння на рівні випускних курсів природничих наук) на рівні 86,9%, що перевищує 73,0% у Claude 4.5 Haiku та 82,3% у GPT-5 mini. MMMU-Pro (мультимодальне міркування) досягає 76,8%. Серед ранніх користувачів — платформа для клієнтського сервісу Gladly, яка повідомляє про зниження витрат на 60% і показник успішності 99,6% на продакшн-навантаженнях, а також JetBrains, що інтегрувала Flash-Lite у інструменти IDE для допомоги розробникам.