HuggingFace开源 ml-intern: ИИ ML-инженер, который читает статьи, обучает и публикует модели

HuggingFace开源 ml-intern: ИИ ML-инженер, который читает статьи, обучает и публикует модели

На этой неделе HuggingFace открыла исходный код проекта ml-intern (github.com/huggingface/ml-intern) — open-source ML-инженера на базе ИИ, который может автономно читать научные статьи, проектировать эксперименты, обучать модели и публиковать результаты на HuggingFace Hub. Проект набрал более 7300 звёзд менее чем за неделю, из них более 6400 — только за текущую неделю.

Что он умеет

Основной рабочий процесс ml-intern охватывает полный цикл ML-исследований:

  • Чтение статей: Автоматический сбор и анализ последних статей с arXiv, извлечение ключевых методов, архитектур и настроек экспериментов
  • Проектирование экспериментов: Автоматическая генерация конфигураций обучения на основе содержания статей
  • Обучение моделей: Выполнение задач обучения с поддержкой планирования GPU-кластеров
  • Публикация моделей: Автоматическая упаковка и отправка моделей на HuggingFace Hub с карточками моделей и результатами бенчмарков

Архитектура проекта включает четыре модуля: agent, backend, frontend и configs. Проект активно развивается — 408 коммитов и 41 открытый PR.

Сравнение с альтернативами

Параметрml-internAutoGluonТрадиционный AutoML
ИсследованияНа основе статейpreset алгоритмыФиксированный поиск
Дизайн экспериментовАгентОптимизация гиперпараметровGrid/random search
ПубликацияАвто-push в HubРучной экспортРучное развертывание

Быстрый старт

git clone https://github.com/huggingface/ml-intern.git
cd ml-intern
pip install -r requirements.txt
export HF_TOKEN=your_token_here
python -m agent.main --task "reproduce paper: attention is all you need"

Источники