Маленькая история о генеративном искусственном интеллекте вызов в рисовании

Генеративный искусственный интеллект в рисовании небольшая история

Понимание концепции работы Генеративного ИИ

Изображение от Dall-e 2

“Небольшая история о Генеративном ИИ: Испытание в рисовании” – это история, которая призвана дать интуитивное понимание того, как работает Генеративный ИИ в формате, который прост и легко усваивается. На протяжении всей истории может не быть ясно, как она связана с Генеративным ИИ, но последний раздел “Заключительные мысли” объяснит, как они связаны. Приятного чтения и не стесняйтесь комментировать!

Испытание в рисовании

Введение

Представьте, что вы и один из ваших хороших друзей только что зарегистрировались на испытание, о котором вы прочитали онлайн. Вы еще не знаете, в чем оно заключается, так как там написано только “Секретное испытание”, но вы участвуете вместе и, конечно, это будет весело!

Это день испытания, и вы и ваш друг только что встретились с администратором у здания, где будет проходить испытание. Она (администратор) говорит вам следовать за ней, так как она покажет вам, где происходит испытание. Вас обоих приводят в пустую комнату с большим оранжевым полом и четырьмя цветными стенами. В комнате нет других участников, столов, стульев или чего-либо еще, кроме двух дверей на каждом конце комнаты и предвкушения того, что произойдет.

Администратор начинает объяснять вам правила: “Правила довольно просты: Всего три комнаты, основная комната и две меньшие комнаты. Испытание разделено на шесть раундов. Одновременно в основной комнате может находиться только один из вас, но вы можете меняться местами в течение каждого раунда. Это означает, что вы не можете видеть или слышать друг друга. Один человек будет находиться в одной из меньших комнат с четырьмя холстами и рисовательными материалами, а другой – в другой маленькой комнате с четырьмя листами бумаги. На каждом из четырех листов бумаги будет что-то; Цель – нарисовать то, что на бумаге, как можно ближе. Вы будете знать, находится ли кто-то в основной комнате по лампе над вашей дверью; она загорится зеленым, когда никого не будет в комнате, и иначе – красным. Вы можете общаться друг с другом между раундами”.

Места испытания состоят из основной комнаты с оранжевым полом, четырех цветных стен (желтой, фиолетовой, синей и зеленой), двух дверей и двух меньших комнат, где будут находиться участники во время раунда.

Перед тем как отправиться в индивидуальные комнаты, администратор кладет прямоугольный куб на пол в основной комнате. Администратор объясняет, что во время раунда в основной комнате может находиться только куб и один из вас. Это означает, что вы можете оставить куб в основной комнате, пока будете меняться местами. Вы берете куб и замечаете, что он немного липкий, но не задумываетесь об этом, так как испытание собирается начаться, и вы взволнованы и очень смущены!

Раунд 1: Чистый лист

Поскольку ваш друг лучше рисует, вы решили, что он будет находиться в комнате с холстом, а вы – в комнате с бумагой. Вы также договорились с другом, что вы должны по очереди заходить в комнату и пытаться передать информацию по одному листу бумаги за раз.

Вы заходите в комнату и видите зеленый свет, который светит над дверью, и четыре листа бумаги, лежащих на земле, как сказала администратор. Вы поднимаете их, чтобы увидеть изображение на каждом листе бумаги:

  • Изображение кота
  • Изображение кухни
  • Изображение бургера
  • Изображение дерева

Вы выбираете первое, изображение кота, и заходите в основную комнату.

В главной комнате вы снова видите широкий пол и большие стены, однаоко дверь на противоположной стороне и куб на полу. Вы довольно смущены, так как заранее ничего не договорились о способе общения с другом. Нечего делать, вы отправляетесь в свою комнату, чтобы обдумать, что делать.

Сразу после того, как вы вошли в свою комнату, вы видите, что свет становится красным, что означает, что ваш друг только что вошел в главную комнату и немного смеется над тем, как он сейчас смущен, так же, как и вы сами. Вскоре после этого лампа снова становится зеленой, что означает, что ваш друг только что покинул комнату, чтобы попробовать угадать, что было на первом из ваших листов. Вы берете второй листок, на котором изображена кухня, и снова входите в комнату, не слишком уверенные, что на этот раз все будет иначе.

И вот вам на удивление, ничего не изменилось! Немного раздраженный, вы пинаете кубик своей туфлей и видите, как он катится немного. Вы можете поиграть в немного странный футбол с кубиком, даже если делать больше нечего, поэтому вы еще несколько раз его пинаете, прежде чем снова отправиться в свою комнату.

Это продолжается, пока вы оба не посетите комнату четыре раза и если вы сами должны это сказать, вы стали довольно хорошими в футболе с кубиком! Но не приблизились к выигрышу в испытании…

Итоги первого раунда

После первого раунда вы и ваш друг снова встречаетесь, вы немного расстроены, так как шансы на победу невелики, но вас удивляет, что ваш друг, по какой-то причине, находится в более хорошем настроении, чем вы. Оба выносите вещи из своих комнат, чтобы увидеть, насколько близко вы находитесь к рисункам друг друга. И, как ни странно, ничего не совпадает! Все нарисованное было случайными вещами, которые не имели никакого отношения к вашим листкам. Вы с недоверием смотрите на своего друга, не потому что изображения не похожи друг на друга, а скорее из-за положительной энергии, которая ярко контрастирует с вашей.

Вы спрашиваете своего друга, почему он в таком хорошем настроении. Он говорит вам, что разгадал, как нарисовать то, что находится на вашем листке, не говоря вместе! Вы смотрите на него с недоумением и просите объяснить подробнее. Он говорит вам, что был довольно смущен, когда впервые вошел в комнату, так как ничего не указывало, что нужно нарисовать; он быстро вошел в свою комнату, чтобы начать вращение. Он ожидал, что второй раз, когда он войдет, комната будет выглядеть так же! “Не такая же? Ты должен быть сумасшедшим”, – сказали вы своему другу. “Это большая комната без чего-либо в ней; как она может выглядеть иначе? В ней даже нет окон”.

Оказалось, что разница в комнате была незначительной, но важной. Каждый раз, когда он заходил в комнату, кубик на полу лежал в разных местах. Зная вас, он знал, что вы, вероятно, использовали его для футбола, но это не было важно, потому что это был ключ к общению!

“Да, вот оно!” – восклицаете вы с восторгом. Вы можете использовать пол, чтобы указать вашему другу, что он должен нарисовать. В хорошем настроении вы оба снова смотрите на свои листки, чтобы увидеть, что он должен нарисовать. Вы соглашаетесь разделить пол на четыре равные клетки, одну для кота, кухни, бургера и дерева. Легко!

Вы говорите администратору, что готовы к следующему раунду.

Раунд 2: Простые группы

Второй раунд начинается, и вы настроены на него! Вы сразу беретесь за листки, так как теперь знаете, что делать. Вы берете первый листок, и на нем, как и ожидалось, изображен кот, одна из форм из прошлого раунда. Вы проверяете, зеленый ли свет. Он зеленый. Вы бежите в комнату, чтобы поставить кубик в область, которую решили предназначить для кошек. Вы снова входите в свою комнату, ожидая, что свет загорится красным. Вы улыбаетесь самому себе, зная, что вы на правильном пути.

После нескольких секунд, смотря на красный свет, вы поворачиваетесь и берете следующий листок. Вас охватывает тревога, когда вы смотрите на листок в ваших руках. Вы берете следующий, все еще в панике от того, что видите. Вы берете последний листок, надеясь, что он отличается, но нет. На листках вы видите:

  • Изображение мыши
  • Изображение собаки
  • Изображение лошади

Это не соответствует тому, на что вы и ваш друг согласились, и вы не знаете, что делать… На самом деле, есть только одно, что нужно сделать: закончить раунд прямо сейчас. По крайней мере, на этот раз вы угадали одну вещь правильно!

Ретроспектива второго раунда

Вы снова встречаетесь с другом. Он выглядит так же счастливым, как вы были в первый раз, когда вошли в комнату с изображением кошки, опять же яркий контраст с тем, как вы себя сейчас чувствуете. Как и ожидалось, ваш друг показывает четыре картины с изображением кошки. Его лицо становится напряженным, когда вы показываете ему листы с изображениями разных животных. Вы соглашаетесь, что на этот раз вы приблизились, но, конечно, далеко от того, чтобы все сделать правильно.

После некоторого размышления вы приходите к идее разделить пол на восемь областей, семь из которых предназначены для каждого типа, который вы видели до сих пор, и одна зарезервирована для случая, когда изображение будет чем-то новым. Вероятность того, что ваш друг угадает правильно в пустой области, будет низкой, но по крайней мере будет одна.

Вы довольно уверены, когда снова входите в каждую из своих комнат; даже если должно появиться что-то новое, вы теперь знаете, что делать.

Раунд 3: Больше групп

Как и ожидалось, на этот раз есть больше знакомства. Вы смотрите на все листы с самого начала, чтобы увидеть, что на них:

  • Изображение мыши
  • Изображение бургера
  • Изображение волка
  • Изображение енота

Вы помните, что мышь должна быть в нижнем левом углу, и поэтому начинаете с нее. Как только вы возвращаетесь, вы берете следующее изображение бургера. С тех пор, как вы последний раз видели что-то, что не было животным, прошло много времени, но помните, что оно должно находиться в верхнем правом углу комнаты! Вы снова входите в комнату и принимаете потери на последних двух листах, располагая их в пустой области.

Ретроспектива третьего раунда: Больше групп

На этот раз вы не настолько обескуражены, так как угадали два из четырех, и вы знали, что есть большая вероятность, что не все будет уже виденным. Вы соглашаетесь, что новое разделение должно выглядеть следующим образом, надеясь, что на этот раз вы угадаете еще больше:

На этот раз вы освоили процесс и можете быстро войти в каждую из своих комнат снова.

Раунд 4: Слишком много, чтобы запомнить

Вы снова заходите в свою комнату… Здесь начинает быть немного знакомо. Как долго это длится? Дни? Недели? Вы смотрите на часы… 45 минут… Хорошо, может, не так долго… Вы на мгновение восхищаетесь, насколько быстро ваш друг делает все эти картины.

Но жизнь продолжается, поэтому вы берете первый лист. Вы видите дерево, вы знаете это, оно было посередине слева. Вы входите в комнату и помещаете куб, как договорились. Вы выходите из комнаты, больше не тратя время на осмотр света, и идете прямо к следующему листу. Изображение лошади, верно, оно было посередине.

Снова вы входите в комнату, чтобы поместить куб на пол. Вы гордитесь, стоя в середине комнаты с руками на боках, наслаждаясь ощущением прогресса и волнения. Получите ли вы на этот раз больше двух правильных ответов? Вы снова покидаете главную комнату, чтобы увидеть, что появится на этот раз. Изображение зебры и тигра, неприятно; наверное, вам нужно что-то изменить снова.

Ретроспектива четвертого раунда

Вы снова встречаетесь с другом; конечно, вы угадали два из четырех. Вы смотрите на картины, которые он сделал, и видите изображение дерева и кошки, кивая себе. Как и ожидалось, нарисовано изображение дерева и лошади… Подождите? Кошка? А не лошадь? Смущенный, вы спрашиваете друга, почему он нарисовал кошку вместо лошади? Он выглядит так же смущенным, как и вы, и отвечает, что вы поместили куб в область кошки! Вы говорите о том, где расположены области лошади и кошки, и обнаруживаете, что ваш друг действительно прав. Вы забыли правильное место для лошади.

Вы даже не могли вспомнить место девяти разных категорий, а теперь их 11…? Вы выражаете свои опасения другу и соглашаетесь, что это не переменная стратегия, поскольку вводятся новые типы. Вы смотрите на примеры, которые вы уже получили, и видите, что большинство из них – животные. У вас возникает идея, а что, если мы разместим похожие друг на друга вещи ближе друг к другу? Вы соглашаетесь, что это хорошая идея, так как это упростит запоминание местоположения вещей!

Вы делаете нижнюю часть пола зоной для животных. Но этого недостаточно, поэтому вы размещаете похожих друг на друга животных ближе друг к другу в подгруппы, например, зебру и лошадь или тигра и кошку. Это упростит запоминание местоположения вещей. Вы также понимаете, что бургеры готовятся на кухне, и размещаете их рядом друг с другом.

Вы уверены, что теперь у вас есть гораздо больше шансов запомнить все разные категории! Начинается следующий раунд.

Раунд 5: Простота

Вас встречает знакомая сцена: небольшая кучка бумаг посреди комнаты. Свет сверху освещает бумаги слабым зеленым сиянием из двери. Вы берете следующую бумагу, с нетерпением ждете, что может принести этот раунд. Первое изображение – бенгальский тигр, кот, похожий на мини-версию тигра. Это кошка, но все же… Вы знаете, где находятся две зоны на полу, но не уверены, нарисует ли ваш друг правильное изображение. Вы решаете, что лучше поместить его посередине между Тигром и Кошкой в надежде, что ваш друг поймет, что это не просто кошка, а кошка, похожая на тигра.

Один вниз, осталось три! Вы делаете ментальный кулачок, прежде чем осмотреть оставшиеся бумаги, ожидая, пока ваш друг закончит свои дела в основной комнате. Вы удивлены и немного смущены, видя то, что на оставшихся бумагах, не из-за отчаяния на этот раз, а потому что облегчены тем, что этот раунд проще, чем предыдущие четыре раунда. Оставшиеся бумаги – это три собаки, одна американская бесшерстная терьер, другая бородатый колли и последняя босерон. Свет меняется на зеленый, и вы входите в комнату, чтобы поместить кубик в зону, зарезервированную для собак.

Ретроспектива пятого раунда

После пятого раунда вы встречаетесь снова со своим другом, чтобы узнать, сколько картин вы угадали. Ваш друг показывает первое изображение – рисунок рыси. Черт возьми! Так близко, но честно говоря, бенгальская кошка больше похожа на ягуара, чем на тигра, и рысь находится где-то посередине между ними… Но по крайней мере ваш друг понял, что вы имели в виду, когда поместили кубик между двумя зонами! Вы торопите друга, чтобы он показал оставшиеся три картины, радостно ожидая, чтобы увидеть, правильны ли остальные. И к счастью, все три из них – изображения собак!

Довольно удовлетворенный, вы вызываете администратора, чтобы похвалиться, что на этот раз вы угадали 3 из 4. Впечатляюще, не так ли? Администратор только покачивает головой, указывая, что картины действительно похожи на собак, но совсем не на тех, что изображены на бумагах. Черт возьми, она права! Картины – все лабрадоры, одна из самых распространенных пород собак, а не три породы, изображенные на бумагах. Она уходит, чтобы дать вам больше времени перед началом последнего раунда.

Следует ли добавить все породы собак на пол? У вас уже была проблема с запоминанием местоположения всего, поэтому это кажется немного чрезмерным… Вы смотрите на бумаги и замечаете, что собаки не просто собаки. Каждая собака отличается по размеру и длине шерсти. Можете ли вы разделить зону собаки на более мелкие зоны, определяющие длину шерсти и рост собаки, вместо создания новых зон для каждой породы собак?

Это хорошая идея, так как это позволяет минимизировать количество зон, но вы понимаете, что есть проблема. Вы только что узнали, что можно заставить друга рисовать новые вещи, поместив кубик между двумя зонами; это произошло с рысью. Проблема с новой идеей заключается в том, что становится сложнее угадать, находится ли кубик между двумя зонами из-за их объединения или только потому, что в одной зоне действительно длинные волосы. Вы решаете отложить эту идею на пока…

Спустя некоторое время, вы до сих пор не нашли хорошего решения или новых идей… АРРРР!… Вы берете прямоугольный кубик, чтобы покрутить его, думая о том, как решить проблему. Он все еще клейкий, не самое приятное ощущение, но лучше, чем ничего в руках. Приглядевшись к кубу поближе, вы понимаете, что по всему его периметру проходят четыре линии, как будто он состоит из пяти маленьких кубиков, сложенных в прямоугольную форму. И теперь, задумавшись об этом, не деформирован ли куб больше, чем изначально? Вы вызываете друга, чтобы он вместе с вами более пристально рассмотрел куб. Оказывается, то, что вы принимали за один прямоугольный куб, на самом деле состоит из пяти кубиков, скрепленных отверткой, которая ослабла из-за всего футбола, которым вы играли с ним! Но каждый куб до сих пор клейкий…

Ваш друг всегда любопытен, поэтому никого не удивляет, что он начинает играть с кубиками. Честно говоря, было бы лучше отдохнуть от всего этого размышления, поэтому вы садитесь, чтобы наблюдать за своим другом, пока он играет с кубиками. Он пытается прижать два из них вместе, чтобы увидеть, достаточно ли они крепкие, чтобы держаться вместе без отвертки. Он медленно убирает одну руку, взволнованно ждет, чтобы увидеть, разойдутся ли кубики, и готов поймать один, если они разлетятся. Конструкция держится. Он кивает, довольный, и переходит к следующей части своего плана — проверить, могут ли два кубика прилипнуть к стене.

Когда ваш друг медленно отрывает руку от стены, на которой прилипли два кубика, в вас пробегает дрожь. “Я понял!” — вы кричите другу, который слегка подпрыгивает от неожиданности и сталкивается с кубиками, которые разлетаются по земле. Ваш друг выглядит немного раздраженным, но любопытным, что вы придумали. “Если пола недостаточно, почему бы не использовать стены тоже!?” Ваш друг просит вас объяснить подробнее. “Ранее мы говорили о разделении области для собак на более мелкие части по длине и размеру шерсти, но согласились, что это не будет хорошей идеей, так как это не позволит создавать новые вещи, например, рысь. Но вот что, если мы поместим один кубик на пол, чтобы указать, какое животное это, и другой кубик на одну из стен, чтобы указать длину и размер шерсти животного?” Вы оба соглашаетесь, что это хороший подход, и решаете использовать не только одну стену, а все стены! Вы также решаете больше не ставить животных и другие вещи на пол, а вместо этого провести следующую реорганизацию:

  • Оранжевый пол разделен на континенты, чтобы было легко указать, из какой географической области вещи.
  • Синяя стена определяет размер вещи и длину шерсти. Они решают, что самый большой размер — это планета, размер VoAGI — слон, а самый маленький — без размера. В то же время, самая длинная длина шерсти — 2 метра, размер VoAGI — полметра, а самая маленькая — совсем нет шерсти.
  • Зеленая стена работает по тому же принципу: одно направление определяет, насколько круги доминируют, а другое — насколько полосы доминируют. Точка в середине может быть эллипсом, длинным кругом, который можно рассматривать как сочетание кругов и полосок.
  • Фиолетовая стена определяет, насколько опасна вещь и насколько она похожа на животное.
  • Желтая стена представляет пищу и деревья. Пища определяет, насколько мы видим вещи как то, что следует съесть. Гамбургер будет на верхней части этой шкалы, так как его можно сразу съесть, в то время как банку фасоли поместят в середину, так как сначала нужно достать бобы. На нижней части будет что-то вроде камня, который (надеюсь) никто не будет есть. Дерево определяет, насколько вещь похожа на дерево, с цветком слева, кустом в середине и деревом справа.

Как только вы заканчиваете решать, как разделить пол и стены, администратор сообщает вам, что начинается шестой и последний раунд. Вы (снова) готовы и довольно взволнованы своей новой тактикой!

Финальный раунд — Раунд 6: Властелины космоса

Это финальный раунд, еще один раз, и затем вы закончите (и, надеюсь, победите)! Вы берете первую бумагу, готовые справиться с этим испытанием. Вы видите на первой бумаге корову, легко. Вы входите в комнату, чтобы покорить пол, словно вам 18 лет и вы снова на танцполе. Вы ставите один куб посреди пола, чтобы сказать другу, что он встречается везде в мире, и еще один куб вокруг средины слева на синей стене, так как это большое животное с короткой шерстью. Вы смотрите на зеленую стену, круги или полосы? Конечно, немного и то и другое, но преимущественно круги и не слишком много, помещая его в верхнюю половину слева. Опасно? Оно не совсем безопасно, но определенно не считается опасным и, конечно, является животным: вы помещаете его в правый нижний угол фиолетовой стены. Еда? Многие люди едят коров, поэтому вы устанавливаете куб примерно в середине высоты, так как это животное, но не кусок мяса. Корова совсем не похожа на растение, поэтому куб размещается в крайнем левом положении. Гениально.

Так же быстро, как вы закончили с первой бумагой, вы проскакиваете через следующие две, одна из которых показывает жирафа, а другая — солнце. По мере завершения третьей бумаги, вам кажется, что вы начинаете понимать это. Вы берете последний лист, готовые увидеть последнее испытание. Столько уверенности было раньше, столько недоверия наполняет вас сейчас. На бумаге нет никакого изображения… На бумаге не совсем “ничего”… просто… нет изображения… Что же на бумаге, вы можете спросить? Текст… Там написано “Гриб шиитаке”. Вы уделяете некоторое время, чтобы взгляд утопал… Вы помните, что никто не сказал вам, что рисунок должен выглядеть как бумага, а именно то, что было на бумаге. Так… можете ли вы расположить кубы так же, как рисунок на бумаге изображал гриб шиитаке, и попросить друга нарисовать его? Вы думаете: “Так даже если у меня есть текст на бумаге, мой друг все равно может нарисовать гриб? Давайте попробуем”. Вы рискуете и размещаете кубы, как если бы на бумаге был изображен гриб шиитаке. Вы ставите куб так, чтобы тот, что на полу, был рядом с Японией. Это маленькое растение, которое можно съесть, поэтому вы помещаете его в верхнюю желтую стену примерно в середине. Это не животное и не опасное, но оно круглое и имеет стебель, поэтому вы помещаете его посередине зеленой стены и в левом нижнем углу фиолетовой стены. Оно маленькое и без волос, поэтому вы помещаете его слева немного выше на синей стене.

Вы покидаете комнату в последний раз. Волнительно.

Заключительные мысли

Цель Генеративного искусственного интеллекта заключается в генерации вещей, как и цель вашего друга — “генерировать/создавать” картины. Но, как и ваш друг, который также может писать текст, Генеративный искусственный интеллект может генерировать все, что мы попросим, если он знает как (ваш друг может не уметь создавать музыку, потому что еще не научился). Мы часто хотим, чтобы искусственный интеллект был очень хорош в маленьких задачах, а не среднестатистический во многих вещах, поэтому мы обычно ограничиваем его только генерацией одного типа контента, например, изображений. Но, как у специалистов и универсалов разные роли на рабочем месте, специализированное и общее искусственное интеллекты могут использоваться для разных задач и иметь свои сильные и слабые стороны.

Генеративный искусственный интеллект все равно может сгенерировать картины, даже когда мы не говорим ему, что нужно создать, как ваш друг сделал в первом раунде, когда вы не знали, как общаться друг с другом. Но часто не практично просто генерировать случайные вещи, поэтому вы хотите способ влиять на то, что генерируется/рисуется. Проблема в том, что вы не можете напрямую сказать Генеративному искусственному интеллекту, что нужно сгенерировать, так же как вы не могли говорить напрямую с вашим другом. Поэтому вам нужно договориться о другом способе сделать это. Способ, которым вы это сделали и способ, которым это делает Генеративный искусственный интеллект, одинаковы: вы помещаете куб внутри комнаты, где различные области зарезервированы для разных вещей. Это называется “Латентное пространство” для Генеративного искусственного интеллекта, что просто модное слово для особой комнаты, в которой вы и ваш друг не можете находиться одновременно.

Если вы хотите успешно справиться с задачей, вам нужно, чтобы ваш друг/Генеративный ИИ хорошо справлялся с двумя вещами:

  1. Генерировать как можно больше разных вещей
  2. Генерировать новые вещи, которые не были ранее видены

И здесь начинаются проблемы. С каждым введением новых вещей все сложнее помнить, где они находятся. Есть два способа решить эту проблему:

  1. Размещать похожие вещи рядом друг с другом
  2. Если на полу недостаточно места, использовать также стены

Первое, что нужно сделать, это разместить похожие вещи поближе друг к другу. Это улучшит возможность генерировать как разнообразный набор вещей, так и новые вещи.

  • Будет легче генерировать много вещей, потому что вам не нужно помнить, где находится каждая вещь, только как выглядят вещи в разных областях. И даже если вы не нарисуете нужную вещь, вы все равно будете близко к ней, так как она будет похожа на вещь в этой области.
  • Также будет легче генерировать новые вещи, потому что внимание будет сосредоточено не на местоположении вещей, а на их внешнем виде. Это означает, что ваш друг будет знать, что он должен нарисовать что-то с немного волосами, когда вы помещаете куб между чем-то без волос и чем-то с длинными волосами.

Второе, что нужно сделать, это использовать не только пол, но и стены. В истории вы и ваш друг говорили о том, что всё можно разместить на полу, но это не будет хорошим решением, так как это разрушит возможность рисовать еще не виденные вещи. Вы не сможете нарисовать вещи, которые еще не видели, потому что вам теперь нужно, скажем, место для собак с длинными и без волос. Если вы добавите их в область собак, то эффект будет таким, что когда куб помещается между собакой и волком, вы не будете знать, является ли это комбинацией из двух или просто собакой с длинными волосами.

Вот почему важно использовать не только пол, но и стены. Это позволяет генерировать больше вещей, потому что на каждой стене можно выразить разные концепции, например, какое животное оно выглядит на полу, а длину и размер волос на стене. Чем больше у вас стен, тем больше вещей можно генерировать/рисовать, но будет также сложнее “просто нарисовать собаку”, так как у вас теперь есть намного больше вариантов. Поэтому количество используемых стен будет зависеть от того, какой у вас есть контроль.

На последнем листе бумаги был написан текст вместо изображения. Генеративный ИИ не интересуется тем, что написано на бумаге, только тем, где кубы размещены в комнате. Генеративные ИИ, такие как Dall-e 2 от OpenAI, создают картины на основе текста, который вы даёте им. Изображение в начале этого блог-поста было создано, дав ему текст “Two people standing in a bright wide white room with a door in the middle.”

Изображение от Dall-e 2

Послесловие

Это завершает “Маленькую историю о Генеративном ИИ: Испытание рисованием”, рассказ о двух друзьях и их пути общения без слов – только с помощью комнаты и нескольких липких кубиков.

Спасибо за чтение; надеюсь, вам понравилась история, и теперь вы лучше понимаете, что такое Генеративный ИИ и как он работает. Проверьте мой профиль для получения больше блог-постов и оставляйте комментарии, если у вас есть вопросы, мысли или идеи для будущих блог-постов.

Я в настоящее время пишу несколько блог-постов, которые будут выпущены в этом году, поэтому подпишитесь, если вы хотите получать уведомления о новых публикациях!

С наилучшими пожеланиями,

Матиас

Если вам понравилась эта книга и вы интересуетесь новыми идеями в области машинного обучения и науки о данных, подпишитесь на членство в VoAGI для полного доступа к моему контенту. Подпишитесь на меня, чтобы получать электронное письмо при публикации новой главы или поста.

Матиас Гренне — VoAGI

Обширное введение в встраивание изображений и автоэнкодеры. Введение в книгу и ее главы — Говорят…

VoAGI.com