Два новых начинания Meta AI для обеспечения справедливости в компьютерном зрении представление лицензии для DINOv2 и выпуск FACET.

Два новых начинания Meta AI лицензия DINOv2 и выпуск FACET для обеспечения справедливости в компьютерном зрении.

В постоянно развивающейся области компьютерного зрения срочной проблемой является необходимость обеспечения справедливости. Этот нарратив раскрывает огромный потенциал ИИ-технологий, особенно в области компьютерного зрения, где они выступают в качестве катализатора прорывных достижений в различных секторах, от поддержки экологических усилий до облегчения совершенствования научных исследований. Однако он откровенно признает врожденные риски, связанные с ростом этой технологии.

Исследователи из Meta AI подчеркивают необходимость достижения важного равновесия – гармоничного баланса между быстрым темпом инноваций и развитием обязательных практик. Эти практики не просто выбор, но и важный щит против потенциального вреда, который эта технология может непреднамеренно причинить исторически маргинализованным сообществам.

Исследователи Meta AI разработали всестороннюю дорожную карту в ответ на этот многогранный вызов. Они начинают с того, что делают DINOv2, продвинутую модель компьютерного зрения, созданную в ходе самонастраивающегося обучения, доступной более широкой аудитории на условиях открытой лицензии Apache 2.0. DINOv2, сокращение от Data-Efficient Image Neural Network Version 2, представляет собой значительный скачок в моделях компьютерного зрения. Он использует методы самонастраивающегося обучения для создания универсальных признаков, позволяя ему понимать и интерпретировать изображения в крайне гибком виде.

Возможности DINOv2 выходят за рамки традиционной классификации изображений. Он прекрасно справляется с множеством задач, включая семантическую сегментацию изображений, где он точно определяет границы объектов и разделяет изображения на смысловые области, и монокулярную оценку глубины, позволяя ему воспринимать пространственную глубину объектов на изображении. Эта универсальность делает DINOv2 мощным инструментом для приложений компьютерного зрения. Это расширение доступности позволяет разработчикам и исследователям использовать возможности DINOv2 в широком спектре приложений, продвигая границы инноваций в области компьютерного зрения еще дальше.

Основой принципа справедливости Meta в компьютерном зрении является представление FACET (FAirness in Computer Vision Evaluation). FACET – это монументальный набор данных, включающий поразительные 32 000 изображений с примерно 50 000 людей. Однако то, что отличает FACET, это тщательная аннотация экспертов-аннотаторов. Эксперты проделали огромную работу по аннотированию набора данных, классифицируя его по нескольким измерениям. Это включает демографические атрибуты, такие как воспринимаемая половая презентация, возрастная группа, а также физические атрибуты, включающие воспринимаемый оттенок кожи и прическу. Замечательно, что FACET включает персонажи, охватывающие различные профессии, такие как “баскетболист” и “врач”. Набор данных дополняется метками для 69 000 масок, что увеличивает его значимость для исследований.

Первичные исследования с использованием FACET уже показали различия в работе передовых моделей в разных демографических группах. Например, эти модели часто сталкиваются с трудностями в точном обнаружении людей с более темным оттенком кожи или с кудрявыми волосами, раскрывая скрытые предрассудки, требующие тщательного изучения.

При оценке производительности с использованием FACET передовые модели показали неравенства в работе в разных демографических группах. Например, модели могут испытывать трудности в обнаружении людей с более темным оттенком кожи, что усугубляется для людей с кудрявыми волосами. Эти различия подчеркивают необходимость тщательной оценки и устранения предвзятости в моделях компьютерного зрения.

Хотя FACET в первую очередь разработан для исследовательской оценки и не предназначен для обучения, у него есть потенциал стать ведущим стандартом для оценки справедливости в моделях компьютерного зрения. Это создает базу для глубокого, нюансированного изучения справедливости в ИИ, выходящего за рамки обычных демографических атрибутов и включающего персонажей.

В заключение, статья Meta усиливает тревожный зов относительно вопросов справедливости в компьютерном зрении, одновременно проливая свет на обнаруженные FACET различия в производительности. Методология Meta включает расширение доступа к продвинутым моделям, таким как DINOv2, и создание первоначального набора данных. Этот многогранный подход подчеркивает их неизменное стремление к содействию инновациям при соблюдении этических стандартов и устранении проблем справедливости. Это подчеркивает их неустанное стремление к ответственному развитию, намечая путь к достижению справедливого искусственного интеллекта – такого, где технологии используются для блага всех.