Предсказание неопределенности на основе энтропии

Prediction of uncertainty based on entropy

Эта статья исследует, как энтропия может быть использована в качестве инструмента для оценки неопределенности в задачах сегментации изображений. Мы разберемся, что такое энтропия и как ее реализовать с помощью Python.

Фото Майкла Джидзика на Unsplash

Работая в Кембриджском университете в качестве научного сотрудника по нейроимиджингу и искусственному интеллекту, я столкнулся с проблемой сегментации изображений на сложных наборах данных мозга с использованием последних методов глубокого обучения, особенно nnU-Net. Во время этого проекта я заметил значительную проблему: недооценку оценки неопределенности. Однако неопределенность является ключевым фактором для надежного принятия решений.

Прежде чем углубляться в детали, посетите мой репозиторий на Github, в котором содержатся все фрагменты кода, обсуждаемые в этой статье.

Важность неопределенности в сегментации изображений

В мире компьютерного зрения и машинного обучения сегментация изображений является центральной проблемой. Будь то в медицинском изображении, автономных автомобилях или робототехнике, точность сегментации является важной для принятия эффективных решений. Однако часто игнорируемым аспектом является оценка неопределенности, связанной с этими сегментациями.

Почему нам следует обращать внимание на неопределенность в сегментации изображений?

Во многих приложениях реального мира неправильная сегментация может привести к серьезным последствиям. Например, если автономный автомобиль неправильно идентифицирует объект или система медицинского изображения неправильно маркирует опухоль, последствия могут быть катастрофическими. Оценка неопределенности дает нам меру того, насколько “уверена” модель в своем предсказании, что позволяет принимать более обоснованные решения.

Мы также можем использовать энтропию как меру неопределенности для улучшения обучения наших нейронных сетей. Эта область известна как “активное обучение”. Эта идея будет рассмотрена в дальнейших статьях, но основная идея заключается в определении зон, в которых модели наиболее неуверены, чтобы сосредоточиться на них. Например, у нас может быть сверточная нейронная сеть, выполняющая сегментацию медицинского изображения головного мозга, но показывающая очень плохие результаты на субъектах с опухолями. Затем мы можем сосредоточить свои усилия на получении большего количества меток такого типа.