Hugging Face disponibiliza em código aberto o ml-intern, um agente de IA para investigação autónoma em ML

Mensagem da Gate News, 22 de abril — A Hugging Face disponibilizou em código aberto o ml-intern, um agente de investigação em ML capaz de concluir autonomamente todo o fluxo de trabalho, desde a leitura de artigos, passando pela organização de conjuntos de dados, lançamento de treino em GPU, avaliação de resultados e iteração de melhorias. O projeto é construído sobre o framework smolagents da Hugging Face e oferece tanto interfaces de CLI como baseadas na web, com código disponível no GitHub.

O conjunto de ferramentas do ml-intern foi concebido em torno do ecossistema da Hugging Face. Obtém artigos de arXiv e HF Papers enquanto traça cadeias de citações para uma leitura mais aprofundada; navega por conjuntos de dados no HF Hub, valida a qualidade e reformata os dados para treino; e, quando os recursos de GPU locais não estão disponíveis, recorre a HF Jobs para lançar tarefas de treino na cloud. Após a conclusão do treino, o agente lê automaticamente as saídas de avaliação, diagnostica as causas de falha e volta a executar experiências. Por padrão, utiliza Claude Sonnet 4.5 para conduzir o ciclo de decisão, com um máximo de 300 iterações por execução e compressão automática de contexto quando excede 170k tokens.

A Hugging Face demonstrou três casos de uso. Numa tarefa de raciocínio científico, o agente identificou os conjuntos de dados OpenScience e NemoTron-CrossThink a partir de cadeias de citação, filtrou sete variantes do ARC, SciQ e MMLU por nível de dificuldade e realizou 12 rondas de fine-tuning supervisionado no Qwen3-1.7B, melhorando as pontuações do GPQA de 10% para 32% em menos de 10 horas. Para uma aplicação médica, o agente concluiu que os conjuntos de dados existentes eram insuficientes, escreveu scripts para gerar 1.100 amostras de dados sintéticos e escalou-os 50 vezes para treino, ultrapassando o desempenho do Codex em 60% no HealthBench. Num cenário de matemática competitiva, o agente escreveu um script de treino em GRPO e lançou o treino em GPUs A100 via HF Spaces, e depois conduziu estudos de ablação após observar a colapsagem da recompensa.

Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário