De acuerdo con la monitorización de Beating.AI, una nueva opción de modelo llamada gemini-3.2-flash-lite-live-preview ha aparecido en la lista de selección de modelos de Google Cloud a partir del 17 de mayo. Los sufijos "lite" y "live" indican que Google está creando una versión especializada optimizada para interacciones en tiempo real de latencia ultra baja.
El CEO de Abacus.AI, Bindu Reddy, reveló previamente que Gemini 3.2 Flash logra el 92% de las capacidades de codificación y razonamiento de GPT-5.5, manteniendo los costos de inferencia en solo 1/20 de los de GPT-5.5, con la mayoría de las consultas devolviendo respuestas por debajo de 200 milisegundos. Los observadores de la industria esperan que este modelo ligero optimizado por costos sea presentado formalmente en Google I/O el 20 de mayo.