Исследователи из НЙУ разработали новую технику искусственного интеллекта для изменения видимого возраста человека на изображениях, сохраняя при этом его уникальные идентифицирующие особенности.

Исследователи из НЙУ создали новую технику искусственного интеллекта для изменения возраста человека на фотографиях, сохраняя его уникальные особенности.

Системы искусственного интеллекта все чаще используются для точной оценки и изменения возраста людей с помощью анализа изображений. Построение моделей, устойчивых к изменениям возраста, требует большого объема данных и высококачественных продолжительных наборов данных, включающих изображения большого числа людей, собранные в течение нескольких лет.

Было разработано множество моделей искусственного интеллекта для выполнения подобных задач, однако многие из них сталкиваются с проблемами при эффективном изменении возрастного признака, сохраняя при этом уникальную биометрическую идентичность человека. Эти системы сталкиваются с типичным вызовом сбора большого набора обучающих данных, состоящих из изображений, показывающих отдельных людей на протяжении многих лет.

Исследователи из Школы инженерии NYU Тандона разработали новую технику искусственного интеллекта для изменения видимого возраста человека на изображениях с сохранением уникальной биометрической идентичности.

Исследователи обучили модель небольшим набором изображений для каждого человека. Кроме того, они использовали отдельный набор изображений с подписями, указывающими возрастную категорию человека: ребенок, подросток, молодой взрослый, среднего возраста, пожилой или старый. Набор изображений включает изображения знаменитостей, сделанные на протяжении всей их жизни, а подписанные картинки объясняют связь между изображениями и возрастом для модели. Впоследствии обученная модель стала применима для моделирования сценариев старения или омоложения, достигая указанного желаемого возраста через текстовую подсказку. Эти текстовые подсказки направляют модель в процессе генерации изображений.

Исследователи использовали предварительно обученный скрытый диффузионный режим, небольшой набор из 20 обучающих лицевых изображений одного человека (для изучения информации, специфичной для его идентичности), а также небольшой вспомогательный набор из 600 пар изображений и подписей (для понимания связи между изображением и его подписью).

Они использовали соответствующие функции потерь для настройки модели. Они также добавляли и удаляли случайные вариации или помехи на изображениях. Кроме того, исследователи использовали технику “DreamBooth” для манипулирования изображениями лиц людей через плавный и контролируемый процесс преобразования с помощью слияния компонент нейронной сети.

Они оценили точность модели в сравнении с альтернативными методами изменения возраста. Для проведения этой оценки 26 добровольцам было поручено сопоставлять сгенерированное изображение с фактической фотографией того же человека. Кроме того, они расширили сравнение с использованием ArcFace, известного алгоритма распознавания лиц. Результаты показали, что их метод демонстрирует превосходную производительность, превосходящую производительность других методов, что приводит к сокращению частоты неправильных отклонений на 44%.

Исследователи обнаружили, что когда обучающий набор данных содержит изображения из категории среднего возраста, сгенерированные изображения эффективно представляют разнообразный диапазон возрастных групп. Более того, если обучающий набор содержит преимущественно изображения пожилых людей, модель сталкивается с проблемами при попытке генерировать изображения, попадающие в крайние категории спектра, такие как дети. Более того, сгенерированные изображения демонстрируют хорошую способность преобразовывать обучающие изображения в старшую возрастную группу, особенно у мужчин по сравнению с женщинами. Это различие может быть вызвано включением макияжа на обучающих изображениях. В то же время, вариации в этнической принадлежности или расе не приводили к заметным и различимым эффектам в сгенерированных результатах.