Philips ускоряет разработку решений в области здравоохранения с помощью платформы MLOps, построенной на Amazon SageMaker

Philips ускоряет разработку решений в сфере здравоохранения с помощью платформы MLOps, основанной на Amazon SageMaker

Это совместный блог с AWS и Philips.

Компания Philips – это компания в области здравоохранения, ориентированная на улучшение жизни людей путем значимой инновации. С 2014 года компания предлагает своим клиентам свою платформу Philips HealthSuite, которая оркестрирует десятки сервисов AWS, которые используют компании в области здравоохранения и наук о жизни для улучшения ухода за пациентами. Она партнерствует с учреждениями здравоохранения, стартапами, университетами и другими компаниями для разработки технологий, помогающих врачам делать более точные диагнозы и предоставлять более персонализированное лечение для миллионов людей по всему миру.

Одним из ключевых факторов стратегии инноваций Philips является искусственный интеллект (ИИ), который позволяет создавать умные и персонализированные продукты и услуги, способствующие улучшению здоровья, улучшению опыта клиентов и оптимизации операционной эффективности.

Amazon SageMaker предоставляет специальные инструменты для операций машинного обучения (MLOps), которые помогают автоматизировать и стандартизировать процессы на протяжении жизненного цикла ML. С помощью инструментов SageMaker MLOps команды могут легко обучать, тестировать, устранять неисправности, разворачивать и управлять моделями ML в масштабе, чтобы повысить производительность ученых-данных и инженеров ML, сохраняя при этом производительность модели в производстве.

В этой статье мы рассказываем, как Philips сотрудничала с AWS для разработки AI ToolSuite – масштабируемой, безопасной и соответствующей требованиям ML-платформы на базе SageMaker. Эта платформа обладает возможностями, охватывающими экспериментирование, аннотацию данных, обучение, развертывание моделей и повторное использование шаблонов. Все эти возможности разработаны с целью помощи различным бизнес-линиям в инновациях с быстротой и гибкостью, при этом сохраняя масштаб контроля из центра. Мы описываем ключевые примеры использования, которые определили требования для первой итерации платформы, основные компоненты и достигнутые результаты. Мы также указываем на наши текущие усилия по оснащению платформы генеративными рабочими нагрузками AI и оперативному принятию новых пользователей и команд в пользование платформой.

Контекст клиента

Philips использует ИИ в различных областях, таких как изображение, диагностика, терапия, личное здоровье и связанное уходом. Некоторые примеры ИИ-решений, разработанных Philips за последние годы, включают:

  • Philips SmartSpeed – ИИ-технология визуализации для МРТ, использующая уникальный глубокий алгоритм машинного обучения на основе Compressed-SENSE для повышения скорости и качества изображения для широкого спектра пациентов
  • Philips eCareManager – телемедицинское решение, использующее ИИ для поддержки удаленного ухода и управления критически больными пациентами в отделениях интенсивной терапии, позволяющее обрабатывать данные пациентов из различных источников, предоставлять практические выводы, оповещения и рекомендации команде ухода
  • Philips Sonicare – интеллектуальная зубная щетка, использующая ИИ для анализа привычек чистки зубов и здоровья полости рта пользователей, а также предоставления реального времени руководства и персонализированных рекомендаций, таких как оптимальное время, давление и охват чистки, для улучшения уровня гигиены полости рта и предотвращения зубной кариеса и заболеваний десен.

В течение многих лет Philips является первопроходцем в разработке алгоритмов, основанных на данных, для поддержки инновационных решений в области здравоохранения. В области диагностического изображения Philips разработала множество приложений машинного обучения для восстановления и интерпретации медицинских изображений, управления рабочим процессом и оптимизации лечения. Также в области мониторинга пациента, лечения, ультразвука и команд личного здоровья создаются алгоритмы машинного обучения и приложения. Однако инновации ограничивались фрагментированными средами разработки ИИ между командами. Эти среды варьируются от отдельных ноутбуков и настольных компьютеров до разнообразных вычислительных кластеров в предприятии и облачной инфраструктуры. Первоначально такая неравнородность позволяла разным командам действовать быстро в своих начальных усилиях по разработке ИИ. Однако она теперь препятствует масштабированию и повышению эффективности процессов разработки ИИ.

Стало очевидно, что для действительного освобождения потенциала проектов на основе данных в Philips необходимо осуществить фундаментальный переход к объединенной и стандартизированной среде.

Основные примеры использования ИИ/ML и требования к платформе

AI/ML-решения могут трансформировать здравоохранение, автоматизируя административные задачи, выполняемые медицинскими специалистами. Например:

  • ИИ может анализировать медицинские изображения для помощи врачам-рентгенологам в более быстрой и точной диагностике заболеваний
  • ИИ может прогнозировать будущие медицинские события, анализируя данные пациентов и улучшая превентивный уход
  • ИИ может рекомендовать индивидуальное лечение, отвечающее потребностям пациентов
  • ИИ может извлекать и структурировать информацию из клинических записей для более эффективной записи
  • ИИ-интерфейсы могут обеспечивать поддержку пациентов при запросах, напоминаниях и проверке симптомов

В целом, AI/ML обещает снижение человеческих ошибок, сэкономленное время и затраты, оптимизированный опыт пациентов и своевременные персонализированные вмешательства.

Одним из ключевых требований для платформы разработки и развертывания ML была возможность ее поддержки непрерывного итеративного процесса разработки и развертывания, как показано на следующей схеме.

Разработка AI-активов начинается в лабораторной среде, где собирается и отбирается информация, после чего модели обучаются и проверяются. Когда модель готова и одобрена для использования, ее развертывают в системы реального производства. После развертывания производится непрерывное мониторинг производительности модели. Реальная производительность и обратная связь в конечном итоге используются для дальнейшего совершенствования модели с полной автоматизацией тренировки и развертывания модели.

Более подробные требования AI ToolSuite были определены на основе трех примеров использования:

  • Разработка компьютерного зрения с целью обнаружения объектов на краю.Команда по науке о данных ожидала автоматизированного рабочего процесса аннотации изображений с использованием ИИ для ускорения трудоемкого процесса разметки.
  • Предоставление команде по науке о данных возможности управления семейством классических моделей машинного обучения для сравнения статистических показателей в нескольких медицинских учреждениях. Для проекта требовалось автоматизировать развертывание моделей, управление экспериментами, мониторинг моделей и обеспечить большее управление процессом от начала до конца для аудита и повторного обучения в будущем.
  • Улучшение качества и сокращение времени разработки моделей глубокого обучения в диагностическом медицинском изображении. Нынешняя вычислительная инфраструктура не позволяла выполнять множество экспериментов параллельно, что замедляло разработку моделей. Кроме того, в целях регулирования необходима полная воспроизводимость обучения модели на протяжении нескольких лет.

Требования к нерабочим характеристикам

Построение масштабируемой и надежной платформы ИИ/МО требует тщательного изучения требований к нерабочим характеристикам. Эти требования выходят за рамки конкретных функциональных возможностей платформы и направлены на обеспечение следующего:

  • Масштабируемость – Платформа AI ToolSuite должна иметь возможность более эффективно масштабировать инфраструктуру по генерации информации Philips, чтобы платформа могла обрабатывать все более увеличивающийся объем данных, пользователей и рабочих нагрузок ИИ/МО без потери производительности. Она должна быть спроектирована так, чтобы масштабироваться горизонтально и вертикально, чтобы удовлетворить увеличивающиеся требования безупречно, обеспечивая централизованное управление ресурсами.
  • Производительность – Платформа должна обеспечивать высокопроизводительные вычислительные возможности для эффективной обработки сложных алгоритмов ИИ/МО. SageMaker предлагает широкий выбор типов экземпляров, включая экземпляры с мощными GPU, которые могут значительно ускорить задачи обучения и вывода модели. Она также должна минимизировать задержку и время ответа, чтобы обеспечить реальные или почти реальные результаты.
  • Надежность – Платформа должна предоставлять высоконадежную и надежную инфраструктуру ИИ, охватывающую несколько зон доступности. Такая архитектура с несколькими зонами доступности должна обеспечивать бесперебойную работу ИИ путем распределения ресурсов и рабочих нагрузок по отдельным центрам обработки данных.
  • Доступность – Платформа должна быть доступна 24/7 с минимальным временем простоя для технического обслуживания и обновлений. Высокая доступность AI ToolSuite должна включать балансировку нагрузки, корректную архитектуру и превентивный мониторинг.
  • Безопасность и управление – Платформа должна использовать надежные меры безопасности, шифрование, контроль доступа, выделенные роли и механизмы аутентификации с непрерывным мониторингом возможных ненормальных действий и проведения проверок безопасности.
  • Управление данными – Эффективное управление данными имеет решающее значение для платформ ИИ/МО. В здравоохранении требуются особо строгие правила управления данными. Оно должно включать функции, такие как версионирование данных, история данных, корпоративное управление данными и обеспечение качества данных для обеспечения точности и надежности результатов.
  • Совместимость – Платформа должна быть спроектирована таким образом, чтобы легко интегрироваться с внутренними хранилищами данных Philips, позволяя беспрепятственный обмен данными и сотрудничество с приложениями сторонних разработчиков.
  • Удерживаемость – Архитектура и кодовая база платформы должны быть хорошо организоваными, модульными и удерживаемыми. Это позволяет инженерам и разработчикам ML Philips обеспечивать обновления, исправления ошибок и будущие улучшения, не нарушая работу всей системы.
  • Оптимизация ресурсов – Платформа должна тщательно мониторить отчеты о использовании ресурсов, чтобы убедиться в эффективном использовании вычислительных ресурсов и выделять ресурсы динамически в соответствии с потребностями. Кроме того, Philips должен использовать инструменты биллинга и управления затратами AWS, чтобы получать уведомления, когда использование превышает выделенный пороговый уровень.
  • Мониторинг и регистрация – Платформа должна использовать оповещения Amazon CloudWatch для комплексного мониторинга и регистрации, что необходимо для отслеживания производительности системы, выявления узких мест и эффективного устранения проблем.
  • Соответствие – Платформа также может помочь улучшить соответствие регуляторным требованиям AI-предложений. Воспроизводимость и прослеживаемость должны быть автоматически включены в процессы обработки данных end-to-end, где множество обязательных документационных материалов, таких как отчеты о происхождении данных и модельные карты, могут быть подготовлены автоматически.
  • Тестирование и валидация – Должны быть установлены строгие процедуры тестирования и валидации, чтобы обеспечить точность и надежность моделей ИИ/МО и предотвратить непреднамеренные предубеждения.

Обзор решения

AI ToolSuite это масштабируемая среда разработки искусственного интеллекта (AI), предлагающая нативные службы SageMaker и связанные с ними службы AI/ML с защитой конфиденциальности и безопасности Philips HealthSuite, а также интеграции с экосистемой Philips. В системе предусмотрены три роли с назначенными наборами прав доступа:

  • Ученый-исследователь данных – Подготовка данных, разработка и обучение моделей в совместной среде работы
  • Инженер машинного обучения (ML) – Производство приложений с машинным обучением, включающее развертывание моделей, контроль и обслуживание
  • Администратор науки о данных – Создание проектов по запросу команды для предоставления отдельных изолированных сред с использованием шаблонов, специфичных для задачи

Разработка платформы проходила через несколько релиз-циклов в итеративном модели открытия, проектирования, разработки, тестирования и развертывания. Из-за уникальности некоторых приложений расширение платформы требовало интеграции существующих пользовательских компонентов, таких как хранилище данных или собственные инструменты для аннотации. На следующей схеме показана трехуровневая архитектура AI ToolSuite, включающая базовую инфраструктуру в качестве первого уровня, общие компоненты машинного обучения в качестве второго уровня и специфичные для проекта шаблоны в качестве третьего уровня.

Уровень 1 включает базовую инфраструктуру:

  • Сетевой уровень с параметризованным доступом к Интернету с высокой доступностью
  • Самообслуживание с использованием кода веб-инфраструктуры
  • Интегрированная среда разработки (IDE) с использованием доменной зоны Amazon SageMaker Studio
  • Роли платформы (администратор науки о данных, ученый-исследователь данных)
  • Хранение артефактов
  • Журналирование и мониторинг для наблюдаемости

Уровень 2 содержит общие компоненты машинного обучения:

  • Автоматическое отслеживание экспериментов для каждой задачи и конвейера
  • Конвейер сборки модели для запуска нового обновления сборки модели
  • Конвейер обучения модели, включающий обучение, оценку и регистрацию модели
  • Конвейер развертывания модели для окончательного тестирования и утверждения
  • Реестр моделей для удобного управления версиями моделей
  • Роль проекта, созданная специально для конкретной задачи и назначенная пользователям SageMaker Studio
  • Репозиторий образов для хранения образов обработки, обучения и вывода, созданных для проекта
  • Репозиторий кода для хранения артефактов кода
  • Веб-служба хранения данных и артефактов проекта Amazon Simple Storage Service (Amazon S3)

Уровень 3 содержит специфичные для проекта шаблоны, которые можно создать с помощью пользовательских компонентов, необходимых для новых проектов. Например:

  • Шаблон 1 – включает компонент для запроса данных и отслеживания истории
  • Шаблон 2 – включает компонент для аннотации данных с использованием специального рабочего процесса аннотации с использованием собственных инструментов для аннотации
  • Шаблон 3 – включает компоненты для настройки пользовательского образа контейнера для настройки среды разработки и процедур обучения, выделенной файловой системы HPC и доступа к локальной среде разработки для пользователей

Ниже приводится схема, демонстрирующая ключевые службы AWS, охватывающие несколько учетных записей AWS для разработки, стадии тестирования и производства.

В следующих разделах мы рассмотрим основные возможности платформы, предоставляемые службами AWS, включая SageMaker, AWS Service Catalog, CloudWatch, AWS Lambda, Amazon Elastic Container Registry (Amazon ECR), Amazon S3, AWS Identity and Access Management (IAM) и др.

Инфраструктура в виде кода

Платформа использует IaC, что позволяет Philips автоматизировать обеспечение и управление инфраструктурными ресурсами. Этот подход также помогает воспроизводимости, масштабируемости, контролю версий, согласованности, безопасности и переносимости для разработки, тестирования или производства.

Доступ к средам AWS

SageMaker и связанные AI/ML-сервисы доступны с защитными ограничениями для подготовки данных, разработки моделей, обучения, аннотирования и развертывания.

Изоляция и сотрудничество

Платформа обеспечивает изоляцию данных путем их отдельного хранения и обработки, что снижает риск несанкционированного доступа или утечек данных.

Платформа способствует сотрудничеству команд, что является неотъемлемым элементом в проектах по искусственному интеллекту, которые обычно включают команды, включающие в себя специалистов по анализу данных, администраторов науки о данных и инженеров MLOps.

Контроль доступа на основе ролей

Контроль доступа на основе ролей (RBAC) является неотъемлемым элементом управления разрешениями и упрощает управление доступом, определяя роли и разрешения структурированным образом. Это упрощает управление разрешениями по мере расширения команд и проектов, а также контроль доступа для различных лиц, задействованных в проектах AWS AI/ML, таких как администратор науки о данных, ученый в области данных, администратор аннотаций, аннотатор и инженер MLOps.

Доступ к хранилищам данных

Платформа позволяет SageMaker получать доступ к хранилищам данных, что обеспечивает эффективное использование данных для обучения моделей и вывода результатов без необходимости дублирования или перемещения данных между различными местами хранения, оптимизируя таким образом использование ресурсов и снижая затраты.

Аннотация с помощью специфических для Philips инструментов аннотации

AWS предлагает набор AI и ML-сервисов, таких как SageMaker, Amazon SageMaker Ground Truth и Amazon Cognito, которые полностью интегрированы с внутренними инструментами аннотации, специфическими для Philips. Эта интеграция позволяет разработчикам обучать и развертывать модели ML, используя аннотированные данные в среде AWS.

Шаблоны ML

Платформа AI ToolSuite предлагает шаблоны в AWS для различных рабочих процессов ML. Эти шаблоны представляют собой предварительно настроенные инфраструктурные настройки, адаптированные к конкретным случаям использования ML, и доступны через сервисы, такие как шаблоны проектов SageMaker, AWS CloudFormation и Service Catalog.

Интеграция с Philips GitHub

Интеграция с GitHub повышает эффективность, предоставляя централизованную платформу для управления версиями, кодового ревью и автоматизированных процессов непрерывной интеграции и развертывания (CI/CD), сокращая ручные задачи и повышая производительность.

Интеграция с Visual Studio Code

Интеграция с Visual Studio Code обеспечивает унифицированную среду для написания кода, отладки и управления проектами ML. Это упрощает весь рабочий процесс ML, снижает переключение контекста и экономит время. Интеграция также улучшает сотрудничество между членами команды, позволяя им работать над проектами SageMaker вместе в знакомой среде разработки, используя системы контроля версий и безопасно обмениваясь кодом и блокнотами.

Отслеживание происхождения модели и данных для воспроизводимости и соответствия

Платформа обеспечивает версионирование, что помогает отслеживать изменения в данных обучения и вывода модели ученого о данных со временем, что упрощает воспроизведение результатов и понимание эволюции наборов данных.

Платформа также позволяет отслеживать эксперименты SageMaker, что позволяет конечным пользователям вести журнал и отслеживать все метаданные, связанные с их экспериментами по ML, включая гиперпараметры, входные данные, код и модельные артефакты. Эти возможности необходимы для демонстрации соответствия требованиям регулирующих стандартов и обеспечения прозрачности и ответственности в рабочих процессах AI/ML.

Создание отчетов по спецификации AI/ML для соблюдения регулирующих норм

AWS имеет сертификаты соответствия для различных отраслевых стандартов и регулирующих норм. Отчеты по спецификации AI/ML являются основными документами о соответствии, демонстрирующим соблюдение требований регулирования. Эти отчеты документируют версии наборов данных, моделей и кода. Контроль версий необходим для поддержания происхождения данных, их отслеживаемости и воспроизводимости, что является критическим для соблюдения регулирования и аудита.

Управление бюджетом на уровне проекта

Управление бюджетом на уровне проекта позволяет организации устанавливать ограничения на расходы, помогая избежать неожиданных затрат и обеспечивая соблюдение бюджета проектов машинного обучения. Благодаря управлению бюджетом организация может выделять конкретные бюджеты отдельным проектам или командам, что помогает командам выявлять неэффективность использования ресурсов или неожиданные повышения затрат на ранних этапах. Помимо управления бюджетом, с функцией автоматического отключения неактивных блокнотов участники команды избегают оплаты неиспользуемых ресурсов, а также освобождают ценные ресурсы, когда они неактивны, что делает их доступными для других задач или пользователей.

Результаты

AИнструментальный наборбыл разработан и реализован как платформа для разработки и развертывания машинного обучения (ML) для ученых данных во всех бизнес-единицах Philips. Были собраны и учтены разнообразные требования от всех бизнес-подразделений во время проектирования и разработки. В начале проекта Philips выделил представителей из бизнес-команд, которые предоставляли обратную связь и помогали оценить ценность платформы.

Были достигнуты следующие результаты:

  • Принятие пользователей – один из ключевых ведущих показателей для Philips. Пользователи из нескольких бизнес-подразделений прошли обучение и присоединились к платформе, и ожидается, что это число будет расти в 2024 году.
  • Еще одной важной метрикой является эффективность для пользователей науки о данных. С помощью инструментального набора AI новые среды разработки ML развертываются менее чем за час вместо нескольких дней.
  • Команды науки о данных могут получить доступ к масштабируемой, надежной, эффективной с точки зрения затрат облачной вычислительной инфраструктуре.
  • Команды могут одновременно запускать несколько экспериментов по обучению моделей, что значительно сократило среднее время обучения с нескольких недель до 1-3 дней.
  • Благодаря полностью автоматизированному развертыванию окружения, требуется практически никакого участия инженеров облачной инфраструктуры, что снижает операционные затраты.
  • Использование инструментального набора AI значительно улучшило общую зрелость данных и реализаций ИИ, стимулируя использование хороших практик машинного обучения, стандартизированных рабочих процессов и полной воспроизводимости, что является критичным в соблюдении регулирующих норм в сфере здравоохранения.

Взгляд в будущее с помощью генеративного искусственного интеллекта

В то время как организации гонятся за принятием новейших достижений искусственного интеллекта, важно внедрять новые технологии с учетом политики безопасности и управления организации. Архитектура инструментального набора AI предоставляет отличный шаблон для обеспечения доступа к возможностям генеративного искусственного интеллекта в AWS для различных команд в Philips. Команды могут использовать основные модели, доступные с помощью Amazon SageMaker JumpStart, которая предоставляет огромное количество моделей с открытым исходным кодом от Hugging Face и других поставщиков. С необходимыми ограничениями уже установленными в терминах контроля доступа, предоставления проекта и контроля затрат, командам будет легко начать использовать возможности генеративного искусственного интеллекта внутри SageMaker.

Кроме того, доступ к Amazon Bedrock, полностью управляемому API-ориентированному сервису для генеративного искусственного интеллекта, может быть предоставлен для отдельных учетных записей в соответствии с требованиями проекта, и пользователи могут получать доступ к API Amazon Bedrock как через интерфейс блокнота SageMaker, так и через предпочтительную среду разработки.

Существуют дополнительные факторы, касающиеся внедрения генеративного искусственного интеллекта в регулируемой среде, такой как здравоохранение. Необходимо тщательно рассмотреть создаваемую ценность генеративных приложений искусственного интеллекта по сравнению с связанными рисками и затратами. Также необходимо создать рамки риска и правовые нормы, регулирующие использование организацией технологий генеративного искусственного интеллекта. В такие механизмы входят вопросы безопасности данных, предубежденности и справедливости, а также соблюдение регулирующих норм в сфере здравоохранения.

Заключение

Philips взял курс на использование силы алгоритмов, основанных на данных, чтобы революционизировать решения в области здравоохранения. На протяжении многих лет инновации в области диагностического изображения привели к созданию нескольких ML-приложений, начиная от реконструкции изображений до управления рабочим процессом и оптимизации лечения. Однако разнообразие настроек, от отдельных ноутбуков до локальных кластеров и облачной инфраструктуры, вызывало значительные проблемы. Отдельное администрирование системы, меры безопасности, поддерживающие механизмы и протоколы данных препятствовали полному представлению о TCO и усложняли переходы между командами. Переход от исследования и разработки к производству был осложнен отсутствием связи и воспроизводимости моделей, делая непрерывное обучение модели затруднительным.

В рамках стратегического сотрудничества между Philips и AWS была создана платформа AI ToolSuite для разработки масштабируемой, надежной и соответствующей правилам ML-платформы с помощью SageMaker. Эта платформа предоставляет возможности, начиная от экспериментирования, аннотирования данных, обучения, развертывания моделей и повторного использования шаблонов. Все эти возможности были построены итеративно в течение нескольких циклов открытия, проектирования, создания, тестирования и развертывания. Это помогло нескольким бизнес-подразделениям инновационного сотрудничества с быстротой и гибкостью, при соблюдении централизованного управления на масштабе.

Это путешествие служит вдохновением для организаций, стремящихся использовать силу искусственного интеллекта и машинного обучения для стимулирования инноваций и повышения эффективности в здравоохранении, в конечном итоге принеся пользу пациентам и медицинским работникам по всему миру. Продолжая строить на этом успехе, компания Philips готова сделать еще большие шаги в повышении результатов в области здравоохранения через инновационные решения на базе искусственного интеллекта.

Для получения дополнительной информации о инновациях компании Philips на AWS посетите страницу Philips на AWS.