Mensaje de Gate News, 23 de abril — Google anunció el 22 de abril que lanzará más adelante este año chips TPU de octava generación separados para entrenamiento e inferencia, reemplazando su diseño combinado anterior. La medida se dirige a cargas de trabajo de agentes de IA y ofrece a los clientes de Google Cloud una alternativa al hardware de Nvidia.
El chip de entrenamiento ofrece 2.8 veces el rendimiento del TPU Ironwood de séptima generación de Google al mismo precio, mientras que el chip de inferencia es 80% más rápido y cuenta con 384 MB de SRAM, el triple de la cantidad en Ironwood. La separación de las capacidades de entrenamiento e inferencia refleja un cambio en la forma en que las empresas optimizan para diferentes demandas computacionales.
La iniciativa está respaldada por una asociación a largo plazo con Broadcom y Anthropic. Anthropic planea utilizar aproximadamente 3.5 gigavatios de cómputo de TPU a través de Broadcom a partir de 2027, y Broadcom se encargará de la fabricación de chips y de los componentes de redes hasta 2031. Anthropic, la startup de IA detrás de Claude, ha visto que sus ingresos anualizados superan recientemente $30 mil millones. Mientras tanto, Apple, Microsoft, Meta y Amazon también están ampliando sus esfuerzos de chips de IA personalizados para reducir la dependencia de Nvidia, que sigue siendo el líder del mercado.