Google Gemini 3.1 Flash-Lite est officiellement lancé : le prix d’entrée est 75 % moins élevé que celui de Claude 4.5 Haiku, avec un score GPQA de 86,9 %

D’après Beating, Google Gemini 3.1 Flash-Lite est passé de la phase de préversion à la disponibilité générale (GA) le 8 mai, devenant le modèle le moins cher et le plus rapide de la série Gemini 3. Le prix en entrée est fixé à 0,25 $ par million de tokens et en sortie à 1,50 $ par million de tokens — les coûts d’entrée sont 75% moins élevés que ceux de Claude 4.5 Haiku (1,00 $) et la sortie est 70% moins chère (5,00 $). Le modèle dispose d’une fenêtre de contexte de 1 million de tokens et atteint un débit de 363 tokens par seconde, soit 45% plus rapide que son prédécesseur Gemini 2.5 Flash.

Les références de performance affichent GPQA Diamond (raisonnement scientifique au niveau licence/graduate) à 86,9%, dépassant Claude 4.5 Haiku (73,0%) et GPT-5 mini (82,3%). MMMU-Pro (raisonnement multimodal) atteint 76,8%. Les premiers utilisateurs incluent la plateforme de service client Gladly, qui indique une réduction de 60% des coûts et un taux de réussite de 99,6% sur des charges de travail en production, ainsi que JetBrains, qui intègre Flash-Lite dans des outils d’assistance de l’IDE.

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire