«Мечты о трубопроводах автоматическое обучение ML на AWS»

«Реализация мечтаний автоматическое обучение машинного обучения на AWS»

Фото Арнольда Франциски на Unsplash

В мире машинного обучения автоматизированные обучающие конвейеры упрощают путь от данных к пониманию. Они автоматизируют различные части жизненного цикла машинного обучения, такие как загрузка данных, предобработка, обучение модели, оценка и развертывание. Amazon Web Services («AWS») предоставляет различные инструменты для разработки автоматизированного обучающего конвейера. В этой статье мы рассмотрим настройку базового автоматизированного обучающего конвейера с использованием классического набора данных iris.

Подготовка к работе: требования и набор инструментов AWS

В этом разделе мы рассмотрим некоторые общие требования, а также краткий обзор инструментов AWS, которые мы будем использовать.

Требования

Если вы решите следовать инструкциям и создать собственный обучающий конвейер, вам понадобятся следующие компоненты.

  • Активная учетная запись AWS (вы можете зарегистрироваться здесь) с полными правами администратора
  • Базовые знания AWS CLI (Мы рассмотрим альтернативы для AWS CLI в будущих публикациях)

Настройка учетной записи AWS и подключение к AWS через CLI выходит за рамки данной статьи, однако, не стесняйтесь обратиться напрямую, если вам нужна помощь.

Набор инструментов

Настройка автоматического обучающего конвейера потребует использования следующих продуктов AWS.

  • S3: Масштабируемое служба объектного хранилища, разработанная для хранения и извлечения любого объема данных из любого места в сети
  • Lambda: Бессерверный вычислительный сервис, который автоматически запускает ваш код в ответ на события, такие как изменение данных в бакете Amazon S3
  • Docker: Docker – это платформа, которая упаковывает, распространяет и управляет приложениями внутри легких, переносимых контейнеров
  • Sagemaker: Полностью управляемый сервис, который предоставляет разработчикам и ученым-исследователям возможность быстро и легко создавать, обучать и развертывать модели машинного обучения
  • Step Functions: Бессерверный сервис рабочего процесса, который позволяет координировать распределенные приложения и микросервисы с помощью визуальных рабочих процессов, позволяя создавать, запускать и визуализировать сложные процессы на масштабе

Реализация автоматизированного обучающего конвейера