OpenAI et Broadcom ont dévoilé Jalapeno, un processeur d’inférence IA sur mesure conçu avec la participation de modèles d’IA, utilisant la technologie 3 nanomètres de TSMC. Selon le PDG de Broadcom, Chen Fu-Yang, les performances de calcul de Jalapeno égalent celles du Blackwell de Nvidia et du TPU de Google, les premiers tests montrant une efficacité énergétique nettement supérieure aux alternatives actuelles du marché et une potentielle réduction de 50 % des coûts d’inférence des grands modèles.
Le cycle de développement de 9 mois de la puce – soit la moitié du délai typique de 18 à 24 mois de l’industrie – marque un record, porté par la participation d’ingénieurs en IA à la conception des circuits et à l’optimisation de l’architecture. Jalapeno devrait être déployé en lots d’ici fin 2026, visant une capacité de déploiement à l’échelle de 10 GW.