Создание искусства из хаоса Диффузионные модели – SMLD

Создание искусства из хаоса Диффузионные модели - SMLD

Воображение создает реальность…

Сгенерированное изображение с помощью Stable Diffusion

В предыдущей статье мы рассмотрели общую структуру моделей диффузии, а также очень популярную категорию – модели диффузии для устранения шума (DDPMs). Теперь мы рассмотрим совершенно другой, но эквивалентный подход к формулированию процесса диффузии. Модели этого класса называются SMLDs, Score Matching via Langevin Dynamics, название, которое станет понятнее позже.

Давайте начнем наше путешествие!

Введение

В основе этих моделей лежит (критерий) функция оценки плотности вероятности p(x), которая представлена как ∇ₓlogp(x).

Это количество определяет направление, в котором мы движемся от случайного образца x₀ к образцу xₙ в области с высокой плотностью. Алгоритм, используемый для этого процесса, называется алгоритмом Ланжевена для выборки.

Как и DDPMs, которые черпали вдохновение из термодинамики, фундаментальная идея SMLDs связана с физикой. В частности, Ланжевенская выборка, известная в физике как Ланжевенская динамика, представляет собой подход к математическому моделированию динамики молекулярных систем, исходно разработанный французским физиком Полем Ланжевеном.

Но достаточно разговоров. Давайте теперь взглянем на саму математику, лежащую в основе этой прекрасной идеи!

Sоответствие оценки через Ланжевенскую динамику

Теоретические основы этой категории моделей диффузии были заложены в важной статье «Генеративное моделирование путем оценки градиентов распределения данных». В соответствии с алгоритмом Ланжевена для выборки мы получаем следующий итерационный процесс:

где:

zₜ∼ N (0, I), ε > 0 и x₀∼ p(x₀) (априорное распределение).

Математически это называется Ланжевенским Марковским Цепным Алгоритмом Монте-Карло (MCMC). Этот процесс позволяет выбирать образцы из распределения вероятностей p(x), используя только ее функцию оценки.