Hugging Face Open-Source ml-intern — AI-агент для автономных ML-исследований

Сообщение Gate News, 22 апреля — Hugging Face выпустила ml-intern с открытым исходным кодом: ML-агент, способный автономно завершать полный рабочий процесс — от чтения статей и организации датасетов до запуска GPU-обучения, оценки результатов и итеративного улучшения. Проект построен на фреймворке smolagents от Hugging Face и предлагает как интерфейс CLI, так и веб-интерфейс, а код доступен на GitHub.

Конвейер инструментов ml-intern разработан с опорой на экосистему Hugging Face. Он извлекает статьи из arXiv и HF Papers, одновременно отслеживая цепочки цитирования для более глубокого чтения; просматривает датасеты на HF Hub, валидирует качество и переоформляет данные для обучения; а когда локальные GPU-ресурсы недоступны, задействует HF Jobs для запуска облачных задач обучения. После завершения обучения агент автоматически читает результаты оценки, диагностирует причины неудач и повторно запускает эксперименты. По умолчанию он использует Claude Sonnet 4.5 для ведения цикла принятия решений, с максимумом 300 итераций за один запуск и автоматическим сжатием контекста при превышении 170k токенов.

Hugging Face продемонстрировала три сценария использования. В задаче научного рассуждения агент нашёл датасеты OpenScience и NemoTron-CrossThink по цепочкам цитирования, отфильтровал семь вариантов из ARC, SciQ и MMLU по уровню сложности и провёл 12 раундов контролируемого дообучения на Qwen3-1.7B, улучшив оценки GPQA с 10% до 32% менее чем за 10 часов. Для медицинского применения агент определил, что существующие датасеты недостаточны, написал скрипты для генерации 1,100 синтетических образцов данных и масштабировал их в 50 раз для обучения, превысив производительность Codex на 60% на HealthBench. В соревновательном математическом сценарии агент написал скрипт обучения GRPO и запустил обучение на A100 GPU через HF Spaces, а затем провёл исследования методом абляции после наблюдения коллапса награды.

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев