Как разработать архитектуру MLOps в AWS?

Строим MLOps-архитектуру в AWS подробный гайд

Руководство для разработчиков и архитекторов, особенно для тех, кто не специализируется в области машинного обучения, по проектированию архитектуры MLOps для их организации

Введение

Согласно исследованию Gartner, только 53% проектов машинного обучения (ML) переходят от концепции к производству. Часто возникает несоответствие между стратегическими целями компании и построенными моделями машинного обучения учеными данных. Может быть недостаток коммуникации между DevOps, безопасностью, юристами, ИТ и учеными данными, что представляет вызовы для запуска модели в производство. Наконец, команде может быть сложно поддерживать модели в работе, выпуская новые модели. Это привело к возникновению MLOps, который применяет принципы DevOps, такие как непрерывная интеграция и непрерывная доставка (CI/CD), автоматизация и сотрудничество, в жизненном цикле машинного обучения – разработка, развертывание и мониторинг.

В этой статье я рассмотрю следующее:

  • Различные этапы процесса машинного обучения
  • Различные компоненты MLOps и объясню, почему они необходимы, не углубляясь в детали, которые необходимы только для ученых данных
  • Диаграммы архитектуры MLOps в зависимости от размера и зрелости организации
  • Общие рекомендации по началу пути MLOps

Типичный процесс машинного обучения

Давайте начнем с понимания этапов, входящих в процесс машинного обучения.

Процесс машинного обучения — изображение автора

Процесс машинного обучения имеет следующие компоненты:

  1. Бизнес-проблема и утверждение проблемы машинного обучения: Мы начинаем процесс с определения бизнес-проблемы и соглашения о том, что машинное обучение является правильным решением проблемы. Предлагаемое решение машинного обучения должно давать измеримый бизнес-результат.
  2. Сбор, интеграция и очистка данных: На этом этапе ученые данных/инженеры данных собирают данные, интегрируют их из разных источников, а затем чистят и преобразуют их для удобства использования. Данные…