Google lance des puces IA distinctes pour l’entraînement et l’inférence, avec un gain de performance de 2,8x

Message de Gate News, 23 avril — Google a annoncé le 22 avril qu’il publiera cette année des puces TPU de huitième génération distinctes pour l’entraînement et l’inférence, en remplacement de sa conception précédente combinée. La démarche vise les charges de travail d’agents IA et offre aux clients de Google Cloud une alternative au matériel Nvidia.

La puce d’entraînement offre 2,8 fois les performances du TPU Ironwood de septième génération de Google au même prix, tandis que la puce d’inférence est 80% plus rapide et intègre 384 MB de SRAM, soit trois fois la quantité présente dans Ironwood. La séparation des capacités d’entraînement et d’inférence reflète un changement dans la manière dont les entreprises optimisent pour des besoins de calcul différents.

L’initiative s’appuie sur un partenariat de long terme avec Broadcom et Anthropic. Anthropic prévoit d’utiliser environ 3,5 gigawatts de calcul TPU via Broadcom à partir de 2027, Broadcom assurant la fabrication des puces et les composants réseau jusqu’en 2031. Anthropic, la startup d’IA à l’origine de Claude, a vu récemment son chiffre d’affaires annualisé dépasser $30 milliard. Pendant ce temps, Apple, Microsoft, Meta et Amazon élargissent elles aussi leurs efforts de puces IA sur mesure afin de réduire leur dépendance à Nvidia, qui demeure le leader du marché.

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire