Google Cloud met en avant le modèle Gemini 3.2 Flash Lite avec des coûts d’inférence 95% inférieurs à ceux de GPT-5.5

Selon le suivi de Beating.AI, une nouvelle option de modèle nommée gemini-3.2-flash-lite-live-preview est apparue dans la liste de sélection des modèles de Google Cloud au 17 mai. Les suffixes « lite » et « live » indiquent que Google crée une version spécialisée optimisée pour des interactions temps réel à ultra-faible latence.

Le PDG d’Abacus.AI, Bindu Reddy, a précédemment révélé que Gemini 3.2 Flash atteint 92 % des capacités de codage et de raisonnement de GPT-5.5 tout en maintenant les coûts d’inférence à seulement 1/20e de ceux de GPT-5.5, la plupart des requêtes renvoyant des réponses en moins de 200 millisecondes. Des observateurs du secteur s’attendent à ce que ce modèle léger optimisé pour les coûts soit officiellement dévoilé lors de Google I/O le 20 mai.

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire