Как влияет анонимизация изображений на производительность компьютерного зрения? Исследование традиционных и реалистичных техник анонимизации.

Влияние анонимизации изображений на производительность компьютерного зрения исследование техник.

Анонимизация изображений включает изменение визуальных данных для защиты конфиденциальности личности путем затемнения идентифицируемых признаков. С развитием цифровой эпохи возникает все большая необходимость обеспечения защиты персональных данных на изображениях. Однако при обучении моделей компьютерного зрения, анонимизированные данные могут повлиять на точность из-за потери важной информации. Найти баланс между конфиденциальностью и производительностью модели является значительной проблемой. Исследователи непрерывно ищут методы, позволяющие сохранять полезность данных и обеспечивать конфиденциальность.

Проблема индивидуальной конфиденциальности визуальных данных, особенно в исследованиях автономных транспортных средств, является важной в связи с наличием конфиденциальной информации в таких наборах данных. Традиционные методы анонимизации изображений, такие как размытие, обеспечивают конфиденциальность, но могут ухудшить полезность данных для задач компьютерного зрения. Затенение лиц может негативно сказаться на производительности различных моделей компьютерного зрения, особенно когда в фокусе находятся люди. Недавние достижения предлагают реалистичную анонимизацию, заменяя конфиденциальные данные синтезированным контентом из генеративных моделей, что позволяет сохранить больше полезности по сравнению с традиционными методами. Также наблюдается тенденция полной анонимизации человеческого тела, учитывая, что личность может быть распознана по признакам, отличным от лица, таким как походка или одежда.

В том же контексте недавно была опубликована новая статья, в которой подробно рассматривается влияние этих методов анонимизации на ключевые задачи, связанные с автономными транспортными средствами, и сравниваются традиционные методы с более реалистичными.

Вот краткое описание предложенного метода в статье:

Авторы исследуют эффективность и последствия различных методов анонимизации изображений для задач компьютерного зрения, особенно сосредоточиваясь на задачах, связанных с автономными транспортными средствами. Они сравнивают три основных метода: традиционные методы, такие как размытие и вырезание маски, и новый подход, называемый реалистичной анонимизацией. Последний заменяет конфиденциальную информацию синтезированным контентом из генеративных моделей, предположительно более эффективно сохраняя полезность изображения по сравнению с традиционными методами.

Для своего исследования они определяют две основные области анонимизации: лицо и все человеческое тело. Они используют аннотации датасета для выделения этих областей.

Для анонимизации лица они полагаются на модель DeepPrivacy2, которая синтезирует лица. Для анонимизации всего тела они используют модель U-Net GAN, которая зависит от аннотаций ключевых точек. Эта модель интегрирована в рамках фреймворка DeepPrivacy2.

Наконец, они решают проблему того, чтобы синтезированные человеческие тела соответствовали не только локальному контексту (например, непосредственному окружению на изображении), но и широкому или глобальному контексту изображения. Они предлагают два решения: ад-хок гистограммное выравнивание и сопоставление гистограмм с оптимизацией по латентным переменным.

Исследователи изучили эффекты методов анонимизации на обучение модели с использованием трех датасетов: COCO2017, Cityscapes и BDD100K. Результаты показали:

  1. Анонимизация лица: Незначительное влияние на Cityscapes и BDD100K, но значительное снижение производительности в COCO по оценке позы.
  2. Анонимизация всего тела: Снижение производительности во всех методах, с реалистичной анонимизацией немного лучше, но все еще отстает от исходного датасета.
  3. Различия в датасетах: Существуют значительные расхождения между BDD100K и Cityscapes, возможно, из-за различий в аннотациях и разрешении.

В сущности, хотя анонимизация обеспечивает конфиденциальность, выбранный метод может влиять на производительность модели. Даже передовые техники требуют доработки, чтобы приблизиться к производительности исходного датасета.

В данной работе авторы изучили влияние анонимизации на модели компьютерного зрения для автономных транспортных средств. Анонимизация лица практически не повлияла на некоторые датасеты, но существенно снизила производительность на других, причем реалистичная анонимизация стала решением. Однако анонимизация всего тела последовательно снижала производительность, хотя реалистичные методы были несколько эффективнее. В то время как реалистичная анонимизация помогает решить проблемы конфиденциальности при сборе данных, она не гарантирует полную конфиденциальность. Ограничения исследования включали использование автоматических аннотаций и определенных архитектур моделей. Дальнейшая работа может совершенствовать эти методы анонимизации и решать проблемы генеративных моделей.