OpenAI et Broadcom dévoilent la puce IA Jalapeño pour l'inférence de LLM.

TIA-4,11%

OpenAI et Broadcom ont dévoilé Jalapeño le 24 juin 2026, une puce accélératrice IA conçue sur mesure spécifiquement pour l'inférence de grands modèles de langage. La puce représente le premier processeur d'intelligence d'OpenAI et le composant initial d'une plateforme de calcul multi-génération planifiée, développée conjointement par les deux entreprises, avec pour objectif déclaré d'améliorer la vitesse, l'efficacité et l'accessibilité des systèmes d'IA avancés. Cette étape reflète une orientation stratégique plus large dans laquelle OpenAI travaille de plus en plus à contrôler l'ensemble de la pile d'infrastructure qui sous-tend ses modèles et applications, plutôt que de se fier uniquement à des plateformes de calcul externes.

Architecture et spécifications techniques de Jalapeño

Jalapeño a été conçu de A à Z sur la base de recherches internes sur les besoins de l'inférence moderne des LLM. Son architecture reflète les enseignements tirés de la feuille de route de développement des modèles d'OpenAI, notamment des considérations sur l'optimisation des noyaux, la gestion de la mémoire, la mise en réseau et les systèmes de service. La puce a été développée en partenariat avec Broadcom et Celestia, qui ont contribué aux processus de fabrication, à l'intégration des cartes et des racks, aux systèmes de mise en réseau et à l'infrastructure de déploiement à grande échelle. Selon les entreprises, la conception vise à rester flexible pour différents grands modèles de langage, sans se limiter à une seule architecture ou gamme de produits.

Les premiers échantillons d'ingénierie exécutent déjà des charges de travail d'apprentissage automatique dans des environnements de laboratoire aux fréquences de fonctionnement et niveaux de puissance cibles, y compris des charges de travail associées à des modèles avancés tels que GPT-5.3-Codex-Spark. Les premières évaluations internes suggèrent que Jalapeño pourrait offrir des performances par watt améliorées par rapport aux accélérateurs IA leaders actuels. L'architecture mettrait l'accent sur une réduction des mouvements de données et une distribution plus équilibrée des ressources de calcul, mémoire et réseau, visant à rapprocher l'utilisation réelle des limites théoriques du matériel. Les technologies silicium de Broadcom, y compris ses composants réseau Tomahawk, sont présentées comme des éléments clés du déploiement à grande échelle.

Rôles des partenariats Broadcom et Celestia

La puce a été développée en partenariat avec Broadcom et Celestia. Broadcom a contribué aux technologies silicium et aux composants réseau, y compris les systèmes réseau Tomahawk. Celestia a contribué aux processus de fabrication, à l'intégration des cartes et des racks, aux systèmes de mise en réseau et à l'infrastructure de déploiement à grande échelle. La conception s'inspire des systèmes de production utilisés dans des produits tels que ChatGPT, Codex et les services basés sur API, ainsi que des exigences anticipées pour les futures applications basées sur des agents.

Stratégie d'intégration de l'infrastructure complète d'OpenAI

L'entreprise a présenté ce développement comme faisant partie d'une évolution plus large vers un modèle économique axé sur le calcul. Dans ce contexte, la puce est présentée comme un effort pour accroître la disponibilité des ressources de calcul, réduire les coûts opérationnels et améliorer la réactivité des systèmes d'IA dans les applications grand public et d'entreprise. La stratégie sous-jacente implique une intégration plus étroite entre le développement de modèles, la conception matérielle et le déploiement de l'infrastructure, permettant une optimisation à l'échelle du système plutôt que dans des composants isolés.

L'approche technique derrière Jalapeño est hautement spécialisée pour l'inférence des LLM plutôt que pour des charges de travail de calcul généralisées. Elle s'inspire des systèmes de production utilisés dans des produits tels que ChatGPT, Codex et les services basés sur API, ainsi que des exigences anticipées pour les futures applications basées sur des agents. L'objectif de conception est de combiner un débit élevé avec une latence réduite, permettant des performances plus réactives pour les cas d'utilisation interactifs de l'IA à grande échelle.

Un aspect clé du programme est la co-conception des systèmes logiciels et matériels, où les modèles et l'infrastructure évoluent ensemble. Cela inclut l'architecture de la puce, les systèmes de mémoire, les couches réseau, les mécanismes d'ordonnancement et les cadres de déploiement. En alignant ces composants, le système vise à améliorer l'efficacité et à réduire le coût par unité d'intelligence fournie.

La stratégie de plateforme plus large positionne Jalapeño comme la première étape d'une feuille de route d'infrastructure à long terme, dont le déploiement progressif est prévu à partir de 2026, intégrant les contributions de Broadcom en silicium et réseaux, et de Celestia en intégration système.

FAQ

Qu'ont annoncé OpenAI et Broadcom le 24 juin 2026 ?

OpenAI et Broadcom ont annoncé Jalapeño, une puce accélératrice IA conçue sur mesure spécifiquement pour l'inférence de grands modèles de langage. La puce représente le premier processeur d'intelligence d'OpenAI et le composant initial d'une plateforme de calcul multi-génération planifiée développée conjointement par les deux entreprises.

Quelles charges de travail les premiers échantillons d'ingénierie de Jalapeño exécutent-ils ?

Les premiers échantillons d'ingénierie exécutent déjà des charges de travail d'apprentissage automatique dans des environnements de laboratoire aux fréquences de fonctionnement et niveaux de puissance cibles, y compris des charges de travail associées à des modèles avancés tels que GPT-5.3-Codex-Spark.

Quand le déploiement progressif de Jalapeño doit-il commencer ?

La stratégie de plateforme plus large positionne Jalapeño comme la première étape d'une feuille de route d'infrastructure à long terme, dont le déploiement progressif est prévu à partir de 2026.

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire