2026-06-20 14:55:46
A OpenAI lança o LifeSciBench para avaliar a IA em tarefas reais de investigação, com 750 itens escritos por especialistas em 7 áreas de biologia
De acordo com o anúncio oficial da OpenAI de 20 de junho, a empresa lançou o LifeSciBench, um novo benchmark de avaliação concebido para testar sistemas de IA em tarefas reais de investigação científica. O benchmark é composto por 750 tarefas escritas por especialistas, distribuídas por 7 fluxos de trabalho de investigação e 7 domínios de biologia, criadas por 173 investigadores com nível de doutoramento e experiência na indústria de biotecnologia ou farmacêutica. Mais de 79% das tarefas exigem