Message de Gate News, 23 avril — Google a annoncé le 22 avril qu’il publiera cette année des puces TPU de huitième génération distinctes pour l’entraînement et l’inférence, en remplacement de sa conception précédente combinée. La démarche vise les charges de travail d’agents IA et offre aux clients de Google Cloud une alternative au matériel Nvidia.
La puce d’entraînement offre 2,8 fois les performances du TPU Ironwood de septième génération de Google au même prix, tandis que la puce d’inférence est 80% plus rapide et intègre 384 MB de SRAM, soit trois fois la quantité présente dans Ironwood. La séparation des capacités d’entraînement et d’inférence reflète un changement dans la manière dont les entreprises optimisent pour des besoins de calcul différents.
L’initiative s’appuie sur un partenariat de long terme avec Broadcom et Anthropic. Anthropic prévoit d’utiliser environ 3,5 gigawatts de calcul TPU via Broadcom à partir de 2027, Broadcom assurant la fabrication des puces et les composants réseau jusqu’en 2031. Anthropic, la startup d’IA à l’origine de Claude, a vu récemment son chiffre d’affaires annualisé dépasser $30 milliard. Pendant ce temps, Apple, Microsoft, Meta et Amazon élargissent elles aussi leurs efforts de puces IA sur mesure afin de réduire leur dépendance à Nvidia, qui demeure le leader du marché.