Генеративные модели и танец шума и структуры

Генеративные модели в мире моды танец шума и структуры

Руководство по созданию цифровых мечтателей

Мне нравится задумываться о том, что поразило бы жителей Возрожденной Италии, пылалых страстью к возможностям человеческого воображения и рациональности, в нашу эпоху технологий. Леонардо да Винчи, мечтавший о летающих машинах, наверняка был бы впечатлен Аэробусом 380, парящим в воздухе, где пассажиры удобно расположены в своих креслах, смотрят фильмы и жалуются на медленный Wi-Fi.

Но среди всех технологий, которые в средние века казались бы колдовством, чудеса генеративного искусственного интеллекта, вероятно, были бы среди наиболее колдовских. Что сказал бы Леонардо, после многих лет работы над портретом Моны Лизы, если бы я показал ему устройство, которое могло бы нарисовать портрет женщины в его стиле всего за несколько секунд? Вот, о чудо:

Портрет женщины в стиле Леонардо да Винчи, написанный DALL-E.

Хотя, признаюсь, у этой женщины нет такой соблазнительной и загадочной улыбки, как у настоящей Моны Лизы (и, после более тщательного рассмотрения, она выглядит несколько смешной), многие из нас сталкивались с поразительными проявлениями генеративного ИИ: от ультрареалистических изображений до пугающих убедительных подделок голосов или даже целых эссе, написанных ИИ.

Генеративные модели искусственного интеллекта – это силиконовые эквиваленты мечтателей: они могут представить что-то из ничего, придать смысл шумам. Они научились танцевать танец порядка и беспорядка. Они уже изменили наше представление о творчестве человека и открыли дверь для тысяч новых приложений, угрожающих целым отраслям и создающих новые.

И мы только начинаем, и большинство этих моделей все еще находятся в своей первозданности. С помощью писаний ChatGPT, изображений DALL-E и Midjourney, а также недавно разработанных генеративных моделей для музыки, таких как StableAudio от Stability AI, мы сталкиваемся с эпохой, где все больше сенсорных сигналов, которыми мы нагружаем наши мозги ежедневно, в некоторой мере изменяются или даже полностью создаются искусственным интеллектом.

Художник за мольбертом, с брызгами хаотического шума на левой стороне полотна, постепенно преобразующимися в структурированный красивый цифровой город справа. Стиль искусства должен быть полу-реалистичным с намеком на сюрреализм. Освещение должно быть мягким и рассеянным, создавая атмосферу сна.

В этой статье я хочу поднять завесу с этого волшебного черного ящика и погрузиться в…