Google Gemini 3.1 Flash-Lite se lanza oficialmente: el precio de entrada es un 75% más barato que Claude 4.5 Haiku, con una puntuación GPQA del 86,9%

De acuerdo con Beating, Google Gemini 3.1 Flash-Lite pasó de vista previa a disponibilidad general (GA) el 8 de mayo, convirtiéndose en el modelo más barato y rápido de la serie Gemini 3. El precio de entrada se fija en 0,25 USD por millón de tokens y el de salida en 1,50 USD por millón de tokens: el coste de entrada es 75% menor que Claude 4.5 Haiku (1,00 USD) y la salida es 70% menor (5,00 USD). El modelo incluye una ventana de contexto de 1 millón de tokens y logra un rendimiento de 363 tokens por segundo, un 45% más rápido que su predecesor Gemini 2.5 Flash.

Los benchmarks de rendimiento muestran GPQA Diamond (razonamiento científico a nivel de posgrado) en 86,9%, superando a Claude 4.5 Haiku con 73,0% y a GPT-5 mini con 82,3%. MMMU-Pro (razonamiento multimodal) alcanza 76,8%. Entre los primeros adoptantes están Gladly, plataforma de atención al cliente, que informa una reducción de costes del 60% y una tasa de éxito del 99,6% en cargas de trabajo de producción, y JetBrains, que integra Flash-Lite en herramientas de asistencia dentro de IDE.

Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
Sin comentarios