Топ 5 стабильных Diffusion API для простой интеграции приложений

Лучшие 5 надежных Diffusion API для удобной интеграции приложений

Введение

API – это выход в настоящую эпоху искусственного интеллекта, где одной из значимых проблем для бизнеса является управление высокими вычислительными требованиями моделей ИИ при их интеграции в программное обеспечение и приложения. Решение этой проблемы представлено в виде интерфейсов прикладного программирования (API). API освобождает вас от проблем с обслуживанием, позволяя сосредоточиться на вашей бизнес-логике и пользовательском опыте. Это значит, что любой может использовать эти API для создания и коммерциализации приложений. В этой статье будет рассмотрены API Stable Diffusion – набор генеративных моделей искусственного интеллекта, ориентированных на генерацию изображений, которые стали важными для различных приложений.

Сначала мы рассмотрим API Segmind, очень эффективный и эффективный вариант. Эти API революционизировали подход разработчиков, дизайнеров и создателей к генерации визуального контента. Мы рассмотрим некоторые из топ-5 API Stable Diffusion, отметим их особенности, примеры использования, ценообразование и многое другое.

Цели обучения

  • Получить представление о моделях Stable Diffusion.
  • Понять основы моделей Stable Diffusion, включая их применение.
  • Понять API в современной разработке программного обеспечения.
  • Исследовать, как API играют ключевую роль в упрощении разработки программного обеспечения и приложений.

Эта статья была опубликована в рамках Data Science Blogathon.

Понимание моделей Stable Diffusion

Что такое модели Stable Diffusion?

Модели Stable Diffusion являются классом генеративных моделей искусственного интеллекта, которые фокусируются на создании изображений высокого качества. Эти модели разработаны для создания реалистичных изображений высокого разрешения с различными применениями. Они характеризуются своей стабильностью и надежностью, которые полезны для задач таких как синтез изображений, передача стиля и аугментация данных.

Модели Stable Diffusion используют процесс диффузии для генерации изображений, при котором шум постепенно добавляется к изображению, пока оно не превратится в сложный и согласованный результат. Этот процесс обеспечивает создание изображений высокого качества с мелкими деталями.

Что такое API?

API, или интерфейсы прикладного программирования, являются набором правил и протоколов, которые позволяют одному программному приложению взаимодействовать и использовать функции или данные другого приложения, сервиса или платформы. API являются посредниками, обеспечивающими интеграцию между программным обеспечением.

В разработке программного обеспечения API предоставляют возможность разработчикам получать доступ к функциям, сервисам или данным из различных источников, включая облачные службы, базы данных или модели искусственного интеллекта, не понимая основных сложностей. Это упрощает разработку и ускоряет создание приложений с богатым функционалом.

API могут быть представлены в различных формах, включая RESTful API, gRPC API и WebSocket API, каждый из которых предназначен для конкретных случаев использования. Они играют важную роль в современном программном обеспечении, позволяя разработчикам использовать возможности сторонних сервисов и функциональности, сосредотачиваясь на основной логике своего приложения.

Топ 5 API Stable Diffusion

Давайте рассмотрим топ 5 API Stable Diffusion в нашем списке, начиная с простого в использовании API Segmind.

1. API Stable Diffusion Segmind

Первое место в нашем списке занимает API Segmind, известный своей простотой в использовании и минимальной настройкой. Если у вас уже есть опыт использования стандартных инструментов API, таких как Postman, вам почти не нужно учиться чему-то новому. Мы рассмотрим кратко, как это можно сделать. Подробные указания по использованию Segmind и Postman вы можете найти в этой статье https://www.analyticsvidhya.com/blog/2023/09/genai-app-integration-using-segmind-api-and-postman/.

GenAI API от Segmind предоставляет множество целей, возможностей и преимуществ. Включаются распознавание изображений в электронной коммерции, моде, архитектуре, такой как DvArch, анимация, удаление фона и т. д. Алгоритмы искусственного интеллекта Segmind доступны через API и площадку на веб-сайте по адресу https://www.segmind.com/models.

Почему Segmind APIs?

Есть множество причин, по которым Segmind занимает верхнюю строчку в нашем списке.

  • Скорость: Segmind предоставляет разработчикам доступ к самым быстрым API Serverless Stable Diffusion.
  • Доступность: Оптимизированные функции Segmind помогают получить наиболее эффективные выводы, расчет за каждый вызов API.
  • Простота использования: Вы можете развернуть их высокопроизводительные API одним щелчком мыши, интегрировать и масштабировать без усилий.
  • Масштабируемость: Segmind автоматически масштабируется для обработки спроса. Вы платите только за вызовы API.

Демонстрация с помощью площадки Segmind API

Площадка API делает использование моделей очень простым. Для демонстрации того, как легко работает площадка API, мы рассмотрим новые мощные модели стабильного распространения, называемые “Dreamshaper SDXL”. Вам нужна только учетная запись, которую можно настроить за несколько минут. Перейдите по адресу https://www.segmind.com/ для регистрации. После регистрации перейдите на страницу моделей и найдите “Dreamshaper SDXL”, новый релиз. Или перейдите по этой ссылке https://www.segmind.com/models/sdxl1.0-dreamshaper. После нажатия на модель вы увидите площадку. Кроме площадки, вам также доступен интерфейс вызова API, как показано на скриншоте ниже.

Чтобы попробовать вышеуказанное изображение, вот подсказка, которую я использовал:

Раскрывая кинематографический портрет: Грустный кот 1.25 в скафандре, киберпанк 2077 городской фон, 2D шедевр от Джона Вильгельма, Грумпи 1.2, Киберпанк 1.4, фотореалистичный, октан рендер, HDR, неон, солнечные вспышки, самое лучшее качество 1.9, активная асимметричная поза, полна действия 1.8, популярное на ArtStation, 8K, 35 мм фотография, кино, боке, профессиональная, 4K, высокая детализация.

Вышеуказанный подход предназначен для использования площадки, которая доступна непосредственно на веб-сайте. Второй вариант – использование API. Это мощный инструмент в Segmind. Здесь вы можете использовать вызовы API для создания своего приложения и воспользоваться моделью Segmind.

Использование вызовов Segmind API

Вызовы API позволяют избежать необходимости размещения этих больших и дорогостоящих моделей. Вам не нужно беспокоиться о поддержке сервера или размещении. Вам нужны только основные знания о функциональности API, такие как использование Postman. Весь процесс аналогичен обычным вызовам API. Предположим, что вы используете JavaScript для вашего веб-приложения, вот скрипт для выполнения POST-запроса на Dreamshaper SDXL. Ответом будет jpeg-изображение.

import requestsapi_key = "YOUR API-KEY"url = "https://api.segmind.com/v1/sdxl1.0-dreamshaper"# Request payloaddata = {  "prompt": "кинематографическое фото портрета киберпанка (Грустный кот:1.25) в скафандре, с бесконечной грустью глядя на проходящую Вселенную, киберпанк 2077 городской фон, 2D шедевр от Джона Вильгельма, (Грумпи:1.2), (Киберпанк:1.4), фотореалистичный, октан рендер, HDR, неон, солнечные вспышки, (лучшее качество:1.9), активная асимметричная поза, (полон действия:1.8), популярное на ArtStation, 8K, 35 мм фотография, кино, боке, профессиональная, 4K, высокая детализация",  "negative_prompt": "рисование, живопись, карандаш, эскиз, графит, импрессионистический, шумный, размытый, мягкий, деформированный, уродливый, [деформированный | искалеченный], плохо нарисованный, [плох: неправильная] анатомия, [лишний | отсутствующий | плавающий | отключенный] конечность, (мутировавшие руки и пальцы), размытость",  "samples": 1,  "scheduler": "UniPC",  "num_inference_steps": 35,  "guidance_scale": "7",  "seed": "1135424276",  "img_width": "1024",  "img_height": "1024",  "base64": False}response = requests.post(url, json=data, headers={'x-api-key': api_key})print(response)

Segmind сделал так, чтобы каждая модель имела свой скрипт вызова API на своей странице в виде отдельных документов для удобства и доступности. Все, что вам нужно сделать, это сделать POST-запрос из Postman. Предполагая, что вы разрабатываете на Python, у вас есть скрипт на Python, как показано ниже:

import requests

api_key = "ВАШ API-КЛЮЧ"
url = "https://api.segmind.com/v1/sdxl1.0-dreamshaper"

# Тело запроса
data = {
  "prompt": "кинематографическое фото портрета киберпанк (Грумпи Кэт:1,25) в космическом костюме, с бесконечным горем смотрящего на проходящую мимо вселенную, киберпанк 2077 city bg, 2D шедевр от Джона Вильгельма, (грумпи:1,2), (киберпанк:1,4), фотореалистичный, октановый рендер, HDR, неон, засветы объектива, (лучшее качество:1,9), активная асимметричная поза, (бурная деятельность:1,8), трендящий на artstation, 8к, 35мм фотография, кино, боке, профессиональный, 4к, высоко детализированный",
  "negative_prompt": "рисунок, живопись, карандаш, скетч, графит, импрессионистичный, шумный, размытый, мягкий, деформированный, уродливый, [деформированные| искалеченные] части тела, плохо нарисованная [плохая: неправильная] анатомия, [дополнительные | отсутствующие | плавающие | отсоединенные] конечности, (мутировавшие руки и пальцы), размытость",
  "samples": 1,
  "scheduler": "UniPC",
  "num_inference_steps": 35,
  "guidance_scale": "7",
  "seed": "1135424276",
  "img_width": "1024",
  "img_height": "1024",
  "base64": False
}

response = requests.post(url, json=data, headers={'x-api-key': api_key})
print(response)

Вам нужно только изменить свою подсказку в данных, и ответ, который вы получаете, это сгенерированное изображение в формате JPEG. Вы можете дальше исследовать или обратиться к этой статье https://www.analyticsvidhya.com/blog/2023/09/genai-app-integration-using-segmind-api-and-postman/ для подробного руководства по использованию Segmind с Postman или посетите документацию или репозиторий GitHub для получения дополнительной информации. Ссылки собраны в конце статьи. Далее мы кратко рассмотрим других провайдеров SD API.

2. Stability AI API – Open Source Generative AI

Stability AI, лидер в области открытого генеративного искусственного интеллекта, посвящен развитию инфраструктуры и исследований. Их открытая этика поддерживает язык, код, аудио, видео, 3D-контент, дизайн и биотехнологии. Это стремится дать человечеству возможности искусственного интеллекта.

API Stability AI предлагает гибкий подход к аутентификации, баллам и вызовам API. Пользователям необходимо создать учетную запись, чтобы получить API-ключ, который необходим для доступа к API. Для использования Stability API требуется кредит, и новые пользователи получают 25 бесплатных кредитов при регистрации.

Использование вызовов API

Stability AI немного сложен для новичков, так как он предоставляет более одного типа API. Помимо стандартного REST, они предоставляют gRPC API. Вы можете ознакомиться с руководствами по использованию на GitHub https://github.com/Stability-AI/. Вы можете ознакомиться с документацией, в которой приведены все вызовы API, но для выполнения генерации текста в изображение структура выглядит следующим образом на языке Python.

import base64
import os
import requests

engine_id = "stable-diffusion-xl-1024-v1-0"
api_host = os.getenv('API_HOST', 'https://api.stability.ai')
api_key = os.getenv("STABILITY_API_KEY")

if api_key is None:
    raise Exception("Missing Stability API key.")

response = requests.post(
    f"{api_host}/v1/generation/{engine_id}/text-to-image",
    headers={
        "Content-Type": "application/json",
        "Accept": "application/json",
        "Authorization": f"Bearer {api_key}"
    },
    json={
        "text_prompts": [
            {
                "text": "Маяк на утёсе"
            }
        ],
        "cfg_scale": 7,
        "height": 1024,
        "width": 1024,
        "samples": 1,
        "steps": 30,
    },
)

if response.status_code != 200:
    raise Exception("Non-200 response: " + str(response.text))

data = response.json()

for i, image in enumerate(data["artifacts"]):
    with open(f"./out/v1_txt2img_{i}.png", "wb") as f:
        f.write(base64.b64decode(image["base64"]))

Для разработчиков, использующих другие языки программирования, существует скрипт как для Typescript, так и для Go. Подробности можно найти в их документации. Теперь перейдем к следующему API.

3. Hotpot.ai Stable Diffusion API — Настроенный под ваши потребности

API Hotpot.ai Stable Diffusion также предлагает множество вариантов для удовлетворения различных требований. Он разработан с собственными оптимизациями для предприятий и потребителей, предлагая настраиваемую модель Stable Diffusion, которая экономически выгодна. Они позволяют генерировать изображения без необходимости регистрации. Мы воспользуемся их генератором AI Art, чтобы создать изображение, используя первое предложение нашей предыдущей подсказки.

Подсказка:

Создайте произведение искусства, объединяющее элементы киберпанка и футуристического освоения космоса.

Мы можем легко использовать параметр «Стиль», чтобы настроить изображение. Изменение на другой стиль дает следующее изображение.

Ценообразование: Цена на API зависит от таких факторов, как ежемесячный объем, планы подписки и скидки на совместное продвижение. Важно быть осторожным с предложениями об неограниченных пакетах, так как они могут негативно сказаться на надежности и задержках. Hotpot.ai обеспечивает масштабируемость, обрабатывая миллионы запросов на создание изображений при низкой задержке и высокой надежности.

Доступ к API: Доступ к API осуществляется с помощью онлайн-редактора Stable Diffusion, который обеспечивает результаты, идентичные API. Основное отличие заключается в скорости, поскольку пользователи API получают доступ к частным, более мощным серверам для более быстрого создания изображений. Hotpot.ai также предоставляет бесплатные тестовые кредиты для их API Stable Diffusion, делая его доступным для разработчиков.

Кроме того, Hotpot.ai следит за последними версиями Stable Diffusion и в настоящее время предлагает версию 2.1 с планами интеграции Stable Diffusion XL для коммерческих целей.

Давайте посмотрим на скрипт вызова API для Hotpot. Hotpot.ai предлагает API Stable Diffusion бюджетного, стандартного и премиум-уровней. Чтобы использовать API с помощью Python, сначала нужно установить ‘request’.

!pip3 install requestsimport requestsheaders = {  'Authorization': 'API_KEY_HERE',}# измените путь к изображению, которое вы хотите преобразоватьbody = {  'image': open('/полный/путь/к/изображению.jpg', 'rb'),}response = requests.post('https://api.hotpot.ai/remove-background', headers=headers, files=body)# измените путь к файлу, в который вы хотите сохранить полученное изображениеwith open('/полный/путь/к/изображению-без-фона.jpg', 'wb') as file:  file.write(response.content)

Да, даже если вы используете старый и проверенный PHP, вы не останетесь в стороне.

<?php$ch = curl_init();// измените путь к изображению, которое вы хотите преобразовать$body = [  'image' => new CurlFile('/полный/путь/к/изображению.jpg')];curl_setopt($ch, CURLOPT_URL, 'https://api.hotpot.ai/remove-background');curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);curl_setopt($ch, CURLOPT_POST, 1);curl_setopt($ch, CURLOPT_POSTFIELDS, $body);$headers = array('Authorization: API_KEY_HERE');curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);$response = curl_exec($ch);curl_close($ch);// измените путь к файлу, в который вы хотите сохранить полученное изображениеfile_put_contents('/полный/путь/к/изображению-без-фона.jpg', $response);

Если вам нужно больше информации, проверьте GitHub здесь.

4. ZYLA Stable Diffusion API — Переопределение генерации изображений

API ZYLA Stable Diffusion использует передовую модель Stable Diffusion v2.1 для создания изображений высокого качества. Это API предоставляет передовые возможности по генерации изображений, масштабируемости и удобного пользовательского интерфейса. Разработчики, дизайнеры и создатели контента могут усовершенствовать свои проекты с помощью потрясающих и реалистичных изображений. Zyla — это своего рода веб-магазин API. Мы сосредоточимся только на Stable Diffusion API.

Заметные использования для ZYLA SD API

Графический дизайн и реклама: Идеально подходит для создания привлекательной графики для веб-сайтов, социальных сетей и печатных рекламных материалов.

Виртуальная реальность и дополненная реальность: Улучшает визуальную достоверность в приложениях виртуальной и дополненной реальности.

Создание контента и медиапроизводство: Поддерживает кинематографистов, разработчиков игр и студии анимации в создании увлекательного контента.

Электронная коммерция и визуализация товаров: Позволяет улучшить опыт покупок с помощью реалистичных изображений товаров.

Художественное исследование и творческое самовыражение: Возбуждает творчество и художественное исследование.

Обработка изображений и улучшение: Предоставляет продвинутые инструменты для редактирования изображений.

Большинство API имеют бесплатную 7-дневную пробную версию. Вы можете зарегистрироваться и проверить, соответствует ли она вашим потребностям.

API для искусственного интеллекта Image Generator поддерживает Postman как Segmind AI. После регистрации вы получите персональный ключ доступа к API. Он используется для аутентификации с помощью API REST AI Image Generator путем включения вашего токена-носителя в заголовок авторизации. Переменная заголовка в Postman:

Authorization

Для доступа к API вам необходимо зарегистрироваться. После регистрации вы увидите «Ваш ключ доступа к API» и установите [обязательно] для ключа доступа Bearer.

Bearer access_key

Обратите внимание, что ZYLA больше похожа на веб-магазин для API, а SD API – всего лишь одна из коллекций.

5. API Getimg.ai

Это API позволяет вам генерировать и редактировать изображения с использованием последних моделей на основе стабильной диффузии. Вы можете использовать это API для создания изображений, таких как текст в изображение, ControlNet, заполнение пропусков, увеличение масштаба и другие.

Они делают кодирование очень простым. Вот пример отправки POST-запроса к API для генерации изображения на основе текста с использованием cURL:

curl \-X POST https://api.getimg.ai/v1/stable-diffusion/text-to-image \-H "Authorization: Bearer $ ACCESS_TOKEN" \-H "Content-Type: application/json" \-d '{"prompt":"фотография астронавта верхом на лошади на Марсе"}'

Вы можете использовать приведенный выше промпт в игровой площадке, чтобы опробовать модель. Ниже приведен пример генерации одновременно 4 изображений. Это удобно для создания фотографий визажа.

Вы можете настроить промпт для генерации разных изображений в соответствии с вашими требованиями.

Кроме того, getimg.ai предлагает различные варианты ценообразования в зависимости от размера, шагов и выбранных конвейеров. Например, Stable Diffusion XL с разрешением 1024×1024 пикселей и 30 шагами стоит $0.00944 за изображение.

Вы можете найти больше информации об этом API, его сферах применения и ценообразовании на веб-сайте getimg.ai, а также изучить функции и модели, которые они предлагают для создания и редактирования изображений. Для использования API вам необходимо зарегистрироваться и получить ключ API, чтобы аутентифицировать ваши запросы.

Заключение

Генерация изображений быстро развивается, и API Stable Diffusion находятся на передовых позициях. Разработчикам, дизайнерам и создателям контента теперь доступны множество вариантов. Эти API предлагают расширенные функции, масштабируемость и множество сфер применения, делая их незаменимыми инструментами в современном ландшафте искусственного интеллекта. Используйте эти API, чтобы преобразовать свои проекты и насладиться мощью передовых технологий генерации изображений.

Основные положения

  • API Stable Diffusion предлагают безупречный подход к разработке искусственного интеллекта, позволяя разработчикам сосредоточиться на создании продуктов искусственного интеллекта, оставляя обслуживание графического процессора поставщику услуг.
  • Многие API Stable Diffusion предоставляют простой доступ с помощью инструментов, таких как онлайн-редакторы Stable Diffusion, предлагающих идентичные результаты их API, но с улучшенной скоростью.
  • API Stability AI придерживается открытой философии, давая разработчикам открытый доступ к передовым технологиям искусственного интеллекта в различных областях.

Часто задаваемые вопросы

  • https://www.segmind.com/
  • https://www.segmind.com/models
  • https://www.segmind.com/models/sdxl1.0-dreamshaper
  • https://platform.stability.ai/docs/getting-started
  • https://platform.stability.ai/docs/api-reference
  • https://hotpot.ai/stable-diffusion-api
  • https://hotpot.ai/art-generator?s=stable-diffusion-api
  • https://zylalabs.com/api-marketplace/tag/stable+diffusion
  • https://stablediffusionapi.com/
  • https://getimg.ai/tools/api

Изображения, показанные в этой статье, не являются собственностью Analytics Vidhya и используются на усмотрение автора.