Исследователи Чосонского университета представляют машинное обучение для точной локализации обесцвеченных кораллов с использованием классификации мешка гибридных визуальных признаков

Чосонские ученые предлагают точное машинное обучение для локализации обесцвеченных кораллов с использованием гибридных визуальных признаков и классификации в мешке

Самая разнообразная морская среда на Земле находится в коралловых рифах. Более 4000 видов рыб можно найти в коралловых рифах, которые являются домом для примерно 25% всего морского быта. В коралле морская водоросль-паразит или зуксантелла производит яркие карбонатные структуры, известные как рифы. Когда температура воды поднимается, и водоросли покидают ткань коралла, коралловый риф становится обесцвеченным. Обесцвечивание коралловых рифов связано с несколькими экологическими и экономическими проблемами. Глобальное потепление является основной причиной обесцвечивания из-за крайне высокой температуры поверхностей океанов летом. В 2016 году на Великом барьере кораллов в Австралии обесцвечивание уничтожило 29–50% коралловых рифов.

Более того, обесцвечивание повышает уровень CO2 в мировых морях каждый день, делая окружающую среду более кислой и затрудняя формирование скелетов других кораллов и морской жизни. Рифы – это дом для различных видов морской жизни и содержат множество лекарственных веществ, которые могут лечить множество серьезных заболеваний. Для смягчения последствий изменения климата необходимо контролировать и исследовать морскую экологию. Из-за артефактов и фонового шума на подводном изображении системе компьютерного зрения сложно различить объект в переднем плане и фон. Поэтому были разработаны техники для улучшения подводных изображений.

Путем преобразования фотографий в модель HSI и расширения компонентов насыщенности и интенсивности изображения интегрированная цветовая модель (ICM) и метод без учителя исправления цвета (UCM) улучшают контраст. Исследователи, занимающиеся искусственным интеллектом (ИИ), хотят создать надежный и вычислительно эффективный способ обнаружения обесцвеченных коралловых рифов. Однако различия в освещении, размере, ориентации, перспективе, перекрытиях и фоновом шуме ухудшают работу моделей локализации. Глубина камеры, расположение крепления и меняющиеся источники света на площади наблюдения отвечают за изменения масштаба, перспективы и освещения объекта соответственно.

Исследователи из Чосунского университета в рамках этого проекта стремятся создать методы глубокого обучения и ручного извлечения характеристик, способные выдержать геометрические и визуальные отклонения, которые обнаруживаются на фотографиях морских сред.

В то время как особенности внешнего вида включают текстуру объекта и детали цвета, геометрические характеристики в основном зависят от локального распределения кривых и граней, которые формируют форму объекта на изображении. Вариации в освещении, размере, ориентации, перспективе, перекрытиях и фоновом шуме влияют на особенности внешнего вида и геометрии. В большинстве задач классификации ручные извлекатели характеристик заменяются моделями глубоких нейронных сетей (DNN).

Благодаря их независимости от домена и обширному обучению на наборах данных, глубокие нейронные сети (DNN), такие как ResNet, DenseNet, VGGNet и модели Inceptions, достигают непревзойденной производительности в различных приложениях. Из-за отсутствия большого количества образцов обесцвечивания в существующих наборах данных DNN переобучается, что подрывает устойчивость и уникальность характеристик. Однако устойчивость и уникальность ручных характеристик не зависят от силы данных обучения. Тем не менее, несмотря на устойчивость к шумам, инвариантность ручной характеристики подвержена изменениям глубины, подводного освещения и мутности воды. Цель проекта – создать модель извлечения инвариантных характеристик, которая устойчива к изменениям геометрии и фотометрии изображений кораллов.

Предлагаемая схема использует гибридные методы ручного извлечения и DNN для извлечения исходных характеристик, а затем BoF снижает размерность и вносит больше инвариантности для повышения точности классификации. Предлагаемая модель использует локальные характеристики изображения вместо глобальных, чтобы улучшить фотометрическую инвариантность. Кроме того, использование модели “сумка особенностей” снижает размер вектора исходных гибридных характеристик, что уменьшает сложность и потребность в хранении. После множества экспериментов были определены оптимальные патчи, размер кластера, комбинация ядра и классификатор.