SalesForce AI Research BannerGen библиотека с открытым исходным кодом для генерации многорежимных баннеров.

BannerGen библиотека с открытым исходным кодом от SalesForce AI Research для создания многорежимных баннеров

Эффективный графический дизайн – это основа успешной маркетинговой кампании. Он является коммуникационным мостом между дизайнерами и аудиторией, захватывая пользователей, выделяя важные детали и улучшая визуальную сторону кампании. Однако текущие методы требуют большого времени и обеспечивают пошаговую сборку, что требует опыта и не масштабируется легко.

Для решения вышеупомянутой проблемы исследователи Salesforce представили библиотеку с открытым исходным кодом, BannerGen, которая упрощает процесс дизайна с использованием силы генеративного искусственного интеллекта. Библиотека состоит из трех параллельных методов создания баннеров – LayoutDETR, LayoutInstructPix2Pix и Framed Template RetrieveAdapter. Каждый из них был обучен на большом корпусе графических данных, что позволяет ускорить процесс дизайна. Более того, все они были опубликованы в репозитории GitHub BannerGen и могут быть импортированы в качестве модулей Python, что упрощает эксперименты разработчиков с каждым методом. BannerGen также имеет лицензированные шрифты и тщательно разработанные шаблоны, что позволяет разработчикам создавать дизайны высокого качества.

Пользователь может загрузить изображение, для которого он хочет создать баннер. Затем изображение проходит процесс обрезки, сфокусированный на основных элементах, чтобы создать несколько подизображений. Пользователи также могут указать тип баннера, который они хотят, и текст, который они хотят добавить. Подизображения затем интегрируются в выбранный шаблон для создания потрясающей визуальной композиции. Окончательный дизайн генерируется в виде HTML-файла и файла PNG.

Исследователи интегрировали фреймворк VAEGAN в свой подход для соответствия созданных дизайнов реальным шаблонам. В BannerGen также была включена архитектура DETR, которая называется LayoutDETR. Исследователи изменили декодер DETR, чтобы он мог обрабатывать мультимодальные входы переднего плана. Эта архитектура позволяет BannerGen лучше понимать задний и передний планы элементов, что приводит к лучшим результатам.

BannerGen также интегрировал InstructPix2Pix, технику редактирования изображений с использованием моделей диффузии. Она была доработана для преобразования фоновых изображений в изображения с наложенным текстом.

Третий метод, Framed Template RetrieveAdapter, используется для повышения разнообразия созданных дизайнов и состоит из трех компонентов – извлекателя, который находит наиболее подходящую рамку на основе метрик; адаптера, который настраивает входные изображения и тексты, чтобы они вписывались в рамку, и рендерера, который производит дизайн в HTML/CSS, интегрируя задний слой с входными данными пользователя.

В заключение, BannerGen – это мощный и универсальный фреймворк, который позволяет пользователям без проблем создавать индивидуальные баннеры с помощью генеративного искусственного интеллекта. Архитектура BannerGen разработана для извлечения уроков из реальных макетов и понимания фоновых и передних элементов. Окончательный дизайн генерируется в виде HTML-файла и файла PNG, что позволяет легко вносить ручные корректировки и встраивать его в любые медиа для немедленного использования. BannerGen стремится сделать процесс графического дизайна менее трудоемким и помочь пользователям создавать высококачественные и профессиональные дизайны.

Статья SalesForce AI Research BannerGen: библиотека с открытым исходным кодом для создания баннеров с множественными модальностями впервые появилась на MarkTechPost.