SIKaя-pMectpИЧecкaя peЗeя-ИcЛeДoвaHИЯ Paзвивaeт ИcкуcCTBeHHЫЙ HeЙpoИд пo ECфEкTИBHoмy UnИчT F ДaHHыx CyberКЛAd’E

Секретно-мистическая резея-исследования развивает искусственный нейроид по эффективному уничтожению в дыхах киберкладье

Сбор данных может стать основной возможностью непреднамеренного внедрения текстурных предубеждений. Когда модель обучается на предвзятых данных, а затем применяется к данным, не подпадающим под распределение, производительность часто снижается значительно, так как следует прояснить источник и природу предубеждений. В литературе много исследований, направленных на уменьшение или устранение предвзятости. Предшествующие исследования предложили извлекать предубеждение-независимые характеристики с помощью адверсарной обучения, что позволяет модели решать задачу классификации без использования предвзятых данных. Однако, поскольку полностью отделить предубежденные характеристики с помощью адверсарного обучения является сложной задачей, после обучения часто сохраняются текстурные (видовые) представления.

Команда из Daegu Gyeongbuk Institute of Science and Technology (DGIST) создала новую модель трансляции изображений, которая может значительно снизить предубеждения данных. При создании искусственного интеллекта из коллекции фотографий из разных источников, несмотря на наилучшие усилия пользователя, могут существовать предубеждения данных. Созданная модель позволяет достигать высокой производительности анализа изображений, устраняя предубеждения данных без предварительного знания о таких аспектах. Это решение могло бы во многом облегчить развитие автономных транспортных средств, создание контента и сферу здравоохранения.

Глубокие модели машинного обучения часто обучаются на предвзятых наборах данных. Например, при создании набора данных для идентификации бактериальной пневмонии от коронавирусной болезни 2019 года (COVID-19) обстоятельства сбора фотографий могут различаться из-за вероятности заражения COVID-19. В результате возникают небольшие различия в изображениях, из-за чего существующие модели глубокого обучения диагностируют заболевания на основе атрибутов, возникающих из различий в процедурах изображения, а не на основе ключевых характеристик для практической идентификации заболевания.

С использованием потерь пространственной самоподобности, текстурного сосуществования и потерь ГАН (генеративно-состязательная сеть) мы можем генерировать изображения высокого качества с желаемыми свойствами, такими как согласованное содержание и сходные локальные и глобальные текстуры. После того как изображения произведены с помощью обучающих данных, можно обучить классификатор без предвзятости или модифицированную модель сегментации. Самые важные вклады заключаются в следующем:

В качестве альтернативы команда предлагает использовать текстурное сосуществование и потери пространственной самоподобности для трансляции изображений. Задача трансляции изображений является такой, для которой эти потери никогда не изучались отдельно от других. Они демонстрируют, что оптимальные изображения для устранения предубеждений и адаптации к домену могут быть получены путем оптимизации обеих потерь.

Команда представляет методику обучения последующих задач, которая эффективно смягчает неожиданные предубеждения во время обучения путем богатения обучающего набора данных без использования предвзятых меток. Наш подход также независим от модуля сегментации, что позволяет ему работать с передовыми инструментами сегментации. Наш подход может эффективно адаптироваться к этим моделям и повышать производительность путем богатения обучающего набора данных.

Команда продемонстрировала превосходство нашего подхода над передовыми методами устранения предубеждений и адаптации к домену, сравнив его с пятью предвзятыми наборами данных и двумя наборами данных для адаптации к домену, а также генерируя изображения высокого качества в сравнении с предыдущими моделями трансляции изображений.

Созданная глубокая модель машинного обучения превосходит предшествующие алгоритмы, так как она создает набор данных, применяя устранение текстурных предубеждений, а затем использует этот набор данных для обучения.

Она достигла превосходной производительности по сравнению с существующими техниками устранения предубеждений и трансляции изображений при тестировании на наборах данных с текстурными предубеждениями, таких как классификационный набор данных для различения чисел, классификационный набор данных для определения собак и кошек с разными окрасами шерсти и классификационный набор данных с применением других протоколов изображений для различия между COVID-19 и бактериальной пневмонией. Она также демонстрировала более высокую эффективность, чем прежние методы, на наборах данных, содержащих предубеждения, таких как классификационный набор данных, разработанный для различия между мульти-метками и набор данных, предназначенный для различия между статическими фотографиями, GIF и анимированными GIF.