2026-06-20 14:55:46
OpenAI publie LifeSciBench pour évaluer l’IA sur de vraies tâches de recherche, avec 750 éléments rédigés par des experts dans 7 domaines de la biologie
D’après l’annonce officielle d’OpenAI du 20 juin, la société a publié LifeSciBench, un nouveau banc d’évaluation conçu pour mesurer les systèmes d’IA sur des tâches de recherche scientifique en conditions réelles. Le banc de test comprend 750 tâches rédigées par des experts, couvrant 7 workflows de recherche et 7 domaines de la biologie, créées par 173 chercheurs titulaires d’un doctorat, avec une expérience dans l’industrie biotechnologique ou pharmaceutique. Plus de 79 % des tâches nécessitent