Это исследование ИИ предлагает случайные срезы смешивания данных (RSMDA) для превосходной классификации изображений новый подход к улучшению точности и надежности нейронных сетей

Новый подход в повышении точности и надежности нейронных сетей случайные срезы смешивания данных (RSMDA) как исследование ИИ для улучшения классификации изображений

Аугментация данных – критическая техника глубинного обучения, которая включает в себя создание новых обучающих данных путем модификации существующих образцов. Она важна, потому что диверсифицирует обучающие данные, улучшая способность модели обобщать новые, неизвестные примеры. Создание изменений существующих образцов позволяет избежать переобучения и помогает модели изучать более надежные и адаптируемые функции, что является важным для точных прогнозов в реальных сценариях.

Одним из популярных методов является аугментация данных на основе одного изображения, где разделы изображения случайным образом стираются или изменяются разными способами. Расширение методов аугментации данных включает методы исключения подобные адаптивному и пространственному выпадению, нацеленные на устранение переобучения. Методы на основе одного изображения, такие как CutOut, Random Erasing (RE), Hide and Seek (HS), и GridMask, изменяют отдельные изображения для повышения их устойчивости, потенциально теряя ключевые особенности. Методы на основе нескольких изображений, такие как MixUp, CutMix, RICAP и IMEDA, смешивают несколько изображений для диверсификации наборов данных и улучшения производительности модели.

В этом контексте исследователи из Дублинского городского университета, Университета Колледжа Дублина и Университета Голуэй предложили новую технику аугментации данных, называемую Случайным Мешанием Фрагментов Данных (RSMDA). RSMDA стремится преодолеть проблемы методов аугментации данных на основе одного изображения, смешивая фрагменты изображения различными способами – вертикально, горизонтально или комбинированно. RSMDA включает соединение фрагментов одного изображения с другим для создания третьего изображения, тем самым диверсифицируя обучающий набор данных. Кроме того, этот метод изменяет метки исходных изображений для создания аугментированных меток для новых изображений, улучшая процесс обучения с помощью сглаживания меток.

Конкретно, RSMDA состоит из пяти шагов:

  1. Выбор образцов тренировки: Выбираются два изображения и их соответствующие метки.
  2. Смешивание изображений: RSMDA соединяет части этих изображений, чтобы создать новое изображение. Он использует бинарную маску для выбора и объединения секций из каждого изображения.
  3. Корректировка меток: Метки объединенных изображений также корректируются в соответствии с выбранным коэффициентом, что обеспечивает соответствие меткам смешанного изображения.
  4. Разделение и смешивание: Части изображений случайным образом выбираются и смешиваются, чтобы сформировать совмещенное изображение. RSMDA предлагает три стратегии для этого процесса смешивания: по строкам, по столбцам или комбинированно.
  5. Создание аугментированных образцов: Выбранные части одного изображения вставляются в другое изображение в соответствии с выбранной стратегией смешивания. Этот процесс генерирует новые пары изображение-метка, используемые для обучения.

RSMDA был подвергнут тщательной оценке на различных наборах данных и архитектурах сетей. В ходе экспериментов RSMDA исследовал различные стратегии, включая RSMDA(R), что означает Случайное Мешание Вертикальных Фрагментов. Эта конкретная стратегия, RSMDA(R), последовательно показала лучшие результаты в снижении показателей ошибок по сравнению с базовыми моделями и существующими методами аугментации. Более того, RSMDA проявил замечательную устойчивость к атакам adversaries на серых и цветных наборах данных, превосходя традиционные методы аугментации. Визуализации карт активации классов подтвердили эффективность RSMDA в обучении дискриминирующих функций, аналогичных передовым методам аугментации, таким как CutMix. Все эти эксперименты подчеркивают умение RSMDA повышать производительность модели, ее устойчивость и обучение функций в приложениях глубинного обучения.

В этой статье была представлена новая техника аугментации данных – Случайное Мешание Фрагментов Данных (RSMDA), которая была тщательно исследована. RSMDA креативно смешивает части изображений для создания разнообразных образцов обучения, решая ограничения методов на основе одного изображения. Стратегия RSMDA(R), с фокусом на вертикальном смешивании, последовательно превосходила существующие методы в снижении показателей ошибок и продемонстрировала устойчивость к атакам adversaries на различных наборах данных. Возможность RSMDA изучать дискриминирующие функции была подтверждена с помощью карт активации классов, аналогично передовым методам аугментации, таким как CutMix. В целом, RSMDA представляет собой многообещающую технику аугментации, проявляющуюся в улучшении производительности модели, ее устойчивости и обучения функций в приложениях глубинного обучения.