3 способа создания гиперреалистичных лиц с использованием стабильной диффузии

Три способа создания гиперреалистических лиц с использованием стабильной диффузии

 

Тебя когда-нибудь интересовало, как люди создают такие гиперреалистичные лица с помощью AI генерации изображений, в то время как ваши собственные попытки результлируют в глюках и артифактах, которые позволяют им выглядеть очевидно поддельными? Вы пытались настраивать подсказки и параметры, но все равно не можете достичь качества, которое другие получают. Что вы делаете не так?

В этом блоге я расскажу вам о 3 ключевых техниках, которые помогут вам начать создавать гиперреалистичные лица людей с использованием стабильного диффузии. Вначале мы рассмотрим основы проектирования подсказок, чтобы помочь вам генерировать изображения с использованием базовой модели. Затем мы рассмотрим, как обновление до модели Stable Diffusion XL может значительно улучшить качество изображения через большее количество параметров и обучение. Наконец, я представлю вам пользовательскую модель, отрегулированную специально для создания высококачественных портретов.

 

1. Проектирование подсказок

 

Сначала мы научимся писать положительные и отрицательные подсказки для создания реалистичных лиц. Мы будем использовать демонстрационную версию Stable Diffusion 2.1, доступную на Hugging Face Spaces. Она бесплатна, и вы можете начать без настройки ничего.

Ссылка: hf.co/spaces/stabilityai/stable-diffusion

При создании положительной подсказки обязательно включите все необходимые детали и стиль изображения. В этом случае мы хотим сгенерировать изображение молодой женщины, идущей по улице. Мы будем использовать общую отрицательную подсказку, но вы можете добавить дополнительные ключевые слова, чтобы избежать повторения ошибок в изображении.

Положительная подсказка: “Молодая женщина в середине 20-х, идущая по улице, смотрящая прямо в камеру, уверенное и дружелюбное выражение, неформально одетая в современную стильную одежду, фон городской улицы, яркое, солнечное освещение, насыщенные цвета”

Отрицательная подсказка: “искаженный, уродливый, плохой, незрелый, мультфильм, аниме, 3D, рисунок, чб, мультфильм, рисунок, иллюстрация, худшее качество, низкое качество”

  

Мы получили хороший старт. Изображения точные, но качество изображений могло бы быть лучше. Вы можете поиграть с подсказками, но это лучшее, что вы может получить из базовой модели.

 

2. Stable Diffusion XL

 

Мы будем использовать модель Stable Diffusion XL (SDXL) для создания изображений высокого качества. Она достигает этого путем генерации латентного представления с использованием базовой модели, а затем обработки его с помощью рефайнера для создания детализированных и точных изображений.

Ссылка: hf.co/spaces/hysts/SD-XL

Прежде чем мы сгенерируем изображения, прокрутите вниз и откройте “Продвинутые опции”. Мы добавим отрицательную подсказку, установим зерно и применим рефайнер для достижения лучшего качества изображения.

  

Затем мы напишем ту же подсказку, что и раньше с небольшим изменением. Вместо обычной молодой женщины мы сгенерируем изображение молодой индийской женщины.

 

Результат заметно улучшился. Лицевые черты идеальны. Давайте попробуем сгенерировать изображения других этнических групп, чтобы проверить наличие предубеждений и сравнить результаты.

  

У нас получились реалистичные лица, но все изображения имеют фильтры Instagram. Обычно в реальной жизни кожа не такая гладкая. Она имеет акне, пятна, веснушки и морщины.

 

3. CivitAI: RealVisXL V2.0

 

В этой части мы создадим подробные лица с отметками и реалистичной кожей. Для этого мы будем использовать настраиваемую модель от CivitAI (RealVisXL V2.0), которая была донастроена для высококачественных портретов. 

Ссылка: civitai.com/models/139562/realvisxl-v20

Вы можете использовать модель онлайн, нажав на кнопку “Создать”, или скачать ее для использования локально с помощью Stable Diffusion WebUI.

  

Сначала загрузите модель и переместите файл в каталог моделей Stable Diffusion WebUI: C:\WebUI\webui\models\Stable-diffusion. 

Чтобы отобразить модель на WebUI, нажмите кнопку обновления, а затем выберите контрольную точку модели “realvisxl20…”.

  

Мы начнем с написания одинаковых положительных и отрицательных подсказок и создания изображения высокого качества 1024X1024. 

  

Изображение выглядит идеально. Чтобы полностью использовать преимущества настраиваемой модели, нам нужно изменить нашу подсказку.

  

Новые положительные и отрицательные подсказки можно получить, прокрутив страницу модели вниз и щелкнув по понравившемуся реалистичному изображению. Изображения на CivitAI поставляются с положительными и отрицательными подсказками и продвинутым управлением.

Положительная подсказка: “Изображение молодой индийской женщины, сосредоточенной, решительной, сюрреалистической, в динамичной позе, с ультравысоким разрешением, текстурой резкости, высокой детализацией RAW-фотографии, подробным лицом, малой глубиной резкости, резкими глазами, (реалистичной текстурой кожи: 1.2), светлой кожей, dslr, кинопленка”

Отрицательная подсказка: “(худшее качество, низкое качество, иллюстрация, 3D, 2D, рисунок, мультфильм, эскиз), открытый рот”

  

У нас есть подробное изображение индийской женщины с реалистичной кожей. Это улучшенная версия по сравнению с базовой моделью SDXL.

  

Мы создали еще три изображения для сравнения разных этнических групп. Результаты феноменальны, содержат отметки на коже, пористую кожу и точные черты.

 

Вывод

 

Прогресс в генеративном искусстве вскоре достигнет уровня, на котором нам будет трудно отличить реальное и синтетическое изображения друг от друга. Это сигнализирует о устойчивом будущем, где каждый сможет создавать высокореалистичные медиа из простых текстовых подсказок, используя настраиваемые модели, обученные на разнообразных реальных данных. Быстрый прогресс предполагает захватывающий потенциал – возможно, однажды создание фотореалистичного видео, воспроизводящего вашу собственную внешность и речевые особенности, будет таким же простым, как набор описательной подсказки. 

В этом посте мы узнали о создании подсказок, продвинутых моделях Stable Design и настраиваемых моделях для генерации высокоточных и реалистичных лиц. Если вы хотите еще лучших результатов, я предлагаю вам исследовать различные модели высокого качества, доступные на civitai.com.  

****[Абид Али Аван](https://www.polywork.com/kingabzpro)**** (@1abidaliawan) – сертифицированный профессионал в области науки о данных, который с удовольствием создает модели машинного обучения. В настоящее время он сосредоточен на создании контента и написании технических блогов о технологиях машинного обучения и науке о данных. Абид обладает степенью магистра в управлении технологиями и степенью бакалавра в области телекоммуникационной техники. Его цель – создать продукт искусственного интеллекта с использованием графовых нейронных сетей для студентов, страдающих от психических заболеваний.