OpenAI et Broadcom dévoilent la puce IA Jalapeno pour l'inférence de LLM le 25 juin

Selon OpenAI, l'entreprise et Broadcom ont dévoilé Jalapeno le 25 juin, un accélérateur IA personnalisé conçu spécifiquement pour l'inférence de grands modèles de langage.
Développé en partenariat avec Broadcom et Celestica, Jalapeno représente le premier composant d'une plateforme de calcul multi-génération planifiée visant à améliorer la rapidité, l'efficacité et l'accessibilité des systèmes d'IA avancés.
La puce a été construite à partir de recherches internes sur les besoins d'inférence des LLM et intègre l'optimisation des kernels, la gestion de la mémoire, la mise en réseau et les systèmes de service.
Les premiers échantillons techniques exécutent déjà des charges de travail d'apprentissage automatique dans des environnements de laboratoire, y compris celles associées à des modèles avancés tels que GPT-5.3-Codex-Spark, fonctionnant à la fréquence cible et aux niveaux de puissance.
L'architecture met l'accent sur la réduction des mouvements de données et une répartition équilibrée des ressources entre le calcul, la mémoire et le réseau, conçue pour fonctionner avec différents grands modèles de langage.
Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire