OpenAI представляет DALL-E 3, и пользователи могут создавать изображения в ChatGPT

OpenAI представляет DALL-E 3 теперь пользователи могут создавать изображения в ChatGPT

OpenAI представила свою последнюю версию DALL-E в рамках исследовательского превью под названием DALL-E-3 на этой неделе. Согласно блог-посту от стартапа по искусственному интеллекту, DALL-E 3 “понимает значительно больше нюансов и деталей, чем наши предыдущие системы”.

Для корпоративных и ChatGPT Plus клиентов DALL-E 3 станет доступен в следующем месяце через API и Лаборатории. Для радости пользователей DALL-E 3 был нативно построен на основе ChatGPT. Это позволит пользователям ChatGPT создавать индивидуальные, детальные подсказки для DALL-E 3. Это, вероятно, может разблокировать еще более креативные функции и еще больше расширить возможности генеративного искусства AI.

Конечно, если предоставленная ChatGPT подсказка не соответствует ожиданиям, всегда можно попросить чат-бота внести изменения и настройки в соответствии с вашими пожеланиями. Интересно, что даже идентичные подсказки демонстрируют улучшенные результаты между DALL-E 2 и DALL-E 3, согласно OpenAI.

Кроме того, из-за потенциальной ответственности и их обязательства ответственного использования AI OpenAI предприняла меры для ограничения способности DALL-E генерировать насилие, для взрослых или ненавистный контент. Например, DALL-E 3 разработан таким образом, чтобы отклонять запросы на создание изображения в стиле живого художника.

Это, вероятно, является результатом растущей оппозиции со стороны художественного сообщества в отношении использования произведений, созданных людьми, для обучения моделям искусственного интеллекта. Кроме того, авторы также могут исключить свои изображения из тренировки будущих моделей генерации изображений OpenAI.

Почему это важно? Как отмечает OpenAI, современные системы текст-в-изображение часто игнорируют слова или описания. Это заставляет пользователей изучать инженерию подсказок. Таким образом, OpenAI пытается устранить разрыв в навыках между обычными пользователями и опытными пользователями.

Что это означает? Вкратце, DALL-E 3 должен иметь возможность генерировать изображения, полностью соответствующие предоставленному тексту. Если это подтвердится, это будет значительным шагом вперед в искусстве искусственного интеллекта. Это будет функция, которую конкуренты, такие как Midjourney и Stable Diffusion, скорее всего захотят воспроизвести в какой-то форме.

Это не все для DALL-E 3. Как можно ожидать из-за значительных инвестиций Microsoft в OpenAI, они получат прибыль. И этой прибылью будет доступность DALL-E 3 в чате Bing.

Это объявление является еще одной прямой связью между инвестициями Microsoft в OpenAI. Корпорация будет продолжать развивать более мощные генеративные AI инструменты и функции в своем программном обеспечении. Как уже упоминалось выше, DALL-E 3 сейчас находится в режиме исследования и будет доступен для клиентов ChatGPT Plus и корпоративных клиентов в октябре.