Mensagem do Gate News, 22 de abril — A Hugging Face abriu o código do ml-intern, um agente de pesquisa em ML capaz de concluir autonomamente todo o fluxo de trabalho de ler artigos, organizar conjuntos de dados, iniciar treinamento em GPU, avaliar resultados e iterar melhorias. O projeto é construído sobre o framework smolagents da Hugging Face e oferece interfaces tanto via CLI quanto baseadas na web, com o código disponível no GitHub.

O conjunto de ferramentas do ml-intern foi projetado em torno do ecossistema da Hugging Face. Ele recupera artigos do arXiv e do HF Papers enquanto rastreia cadeias de citações para leitura mais profunda; navega por conjuntos de dados no HF Hub, valida a qualidade e reformata os dados para treinamento; e, quando os recursos locais de GPU não estão disponíveis, chama o HF Jobs para iniciar tarefas de treinamento baseadas na nuvem. Após a conclusão do treinamento, o agente lê automaticamente as saídas de avaliação, diagnostica as causas de falha e reexecuta os experimentos. Por padrão, ele usa Claude Sonnet 4.5 para conduzir o loop de decisão, com um máximo de 300 iterações por execução e compressão automática de contexto quando excede 170k tokens.

A Hugging Face demonstrou três casos de uso. Em uma tarefa de raciocínio científico, o agente identificou os conjuntos de dados OpenScience e NemoTron-CrossThink a partir das cadeias de citação, filtrou sete variantes de ARC, SciQ e MMLU por nível de dificuldade e realizou 12 rodadas de fine-tuning supervisionado no Qwen3-1.7B, melhorando as pontuações do GPQA de 10% para 32% em menos de 10 horas. Para uma aplicação médica, o agente concluiu que os conjuntos de dados existentes eram insuficientes, escreveu scripts para gerar 1.100 amostras de dados sintéticos e os escalou em 50 vezes para treinamento, superando o desempenho do Codex em 60% no HealthBench. Em um cenário competitivo de matemática, o agente escreveu um script de treinamento GRPO e iniciou o treinamento em GPUs A100 via HF Spaces, depois conduziu estudos de ablação após observar colapso de recompensas.

Ver fonte

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.

Notícias relacionadas

04-22 08:25

Google Research Lança ReasoningBank: Agentes de IA Aprendem Estratégias de Raciocínio com Sucesso e Fracasso

04-22 07:01

Meta Planeja Rastrear Cliques do Mouse e Digitações de Funcionários dos EUA para Treinar Modelos de IA

04-22 02:00

Meta pretende monitorar a atividade do mouse e do teclado dos funcionários para treinar modelos de IA

04-22 01:11

Moonshot AI Lança Modelo Open-Source Kimi K2.6 com Fluxos de Trabalho Avançados de Agentes

04-21 23:49

A OpenAI lança o ChatGPT Images 2.0 com capacidades de pensamento

Análise aprofundada