Nvidia Blackwell domine le premier benchmark matériel pour agents intelligents : une efficacité énergétique surpassant H200 de 20 fois, écrasant AMD

Selon le suivi Beating, l'organisme d'évaluation Artificial Analysis a publié le premier référentiel matériel pour agents intelligents (Agent) dans l'industrie, le AA-AgentPerf. Les évaluations traditionnelles ressemblent à un « sprint » unique, ne regardant que la vitesse de réponse ; les tâches d'agents intelligents ressemblent à un « relais », où l'IA doit décomposer l'objectif de manière autonome, en tournant en boucle entre la lecture/écriture de fichiers, la réécriture de code et l'exécution de tests. Des interactions fréquentes mettent énormément au défi la capacité mémoire des serveurs et l'efficacité de la planification.

Le référentiel repose sur la reproduction de trajectoires de programmation réelles, en utilisant comme indicateur clé d'efficacité énergétique la « capacité d'agents intelligents concurrents supportés par mégawatt » pour cibler directement les limites de puissance et de financement des centres de données.

La première phase de test a utilisé le modèle open source de 1,6 billion de paramètres DeepSeek V4 Pro. Les résultats montrent que le système de refroidissement liquide Blackwell GB300 NVL72 d'NVIDIA peut supporter 61 400 agents intelligents concurrents par mégawatt, tandis que la génération précédente Hopper HGX H200 ne supportait que 2 600, avec une amélioration de plus de 20 fois en efficacité énergétique. La capacité de traitement par carte graphique unique a également été multipliée par 41. Cela permet, avec le même budget électrique, aux centres de données d’accueillir 20 fois plus d’agents intelligents en simultané, réduisant considérablement le coût de déploiement d’applications telles que la programmation automatique et le service client.

Parmi les premiers résultats, AMD Instinct MI355X est temporairement en retard. L'organisme d’évaluation indique que AMD et H200 utilisent tous deux le cadre open source vLLM pour la configuration, sans optimisation approfondie ; avec l’adaptation des cadres de service et des opérateurs de noyau, les performances d’AMD ont encore du potentiel d’amélioration. Actuellement, des fournisseurs de solutions d’inférence comme Together AI ont déjà déployé DeepSeek V4 Pro sur Blackwell, fournissant un support d’inférence en temps réel pour l’outil de programmation d’agents Cursor.

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire