Что это

Stable Diffusion искусственный интеллект, позволяющий генерировать картинки с использованием текстовых подсказок и не только. Умение создавать уникальные картинки с помощью текстовых описаний новая возможность ИИ, которая вызвала бурную реакцию у пользователей.

Stable Diffusion взорвала интернет именно этим. Из-за относительно невысоких требований к ресурсам памяти компьютера, скорости генерации и качества изображения, нейросеть предоставила творческую свободу иногим пользователям и стала доступной для всех.

Она была создана группой Stability AI и появилась в общем доступе в августе 2022 года. Стоит отметить, что для использования всех функций программы требуется владение навыками программирования.

Преимущества SD

Почему Stable Diffusion стала такой популярной? У программы есть много преимуществ перед конкурентами.

Такие, как:

  • Открытый исходный код с лицензией Creative ML OpenRail-M, что позволяет запускать Stable Diffusion на ПК.
  • Работа со сжатыми версиями изображений. Платформа берёт за основу сжатые версии изображений в отличие от Midjourney или DALL-E 2, которые работают с отдельными пикселями, что значительно замедляет процесс генерации картинки и требует более мощных компьютеров.

  • Возможность рисовать, как да Винчи. В Stable Diffusion интегрированы стили многих художников. Можно создать изображение на основе творчества да Винчи или же вашего любимого художника из Pinterest.
  • Функции Inpainting и Outpainting. Первая фича позволяет менять любой объект на созданной картинке, например, заменить дерево на куст. Вторая даёт возможность дорисовать сгенерированное изображение по вашему усмотрению.

Возможности Stable Diffusion

Нейросеть можно использовать различными образами. Например, наиболее простой и распространённый способ создание изображения только с помощью текста (text2img).

В отведённом поле вводим любые несколько слов (текстовый запрос). В нашем случае это:

  • Dog
  • Paradise
  • Lawn

После этого кликаем «Generate image», ждём несколько секунд и продвинутый ИИ выдаёт модель изображения на основе введённого нами текста. Чудо, не правда ли? Правда, немного странно — для генерации приемлемого изображения может понадобиться несколько попыток и переработка текстового запроса.

Также можно указать слова, изображения которых мы не хотели бы видеть в сгенерированной картинке. Для этого есть специальное поле ниже. Допустим, мы хотим убрать забор. Для этого введём в поле ниже слово «Fence» и нажмём «Generate images». Вот, что получилось.

Детализация = многословность. Чем больше слов вы укажите в поле для генерации изображения, тем более проработанной выйдет картинка. Максимальный предел слов для запроса  75.

Учитывайте порядок слов. SD берёт за основу слова, стоящие в начале списка. Меняя их местами, вы можете получить совершенно другое изображение. Например, если вам не нравится качество цветов, перенесите их описание в начало вашего списка.

«Вес» слов. Если вы хотите, чтобы определённый объект занимал больше места на будущем изображении, укажите около его слова число от 0 до 100. Это будет являться «весом» слова.

Исходный код Stable Diffusion опубликован на GitHub. Программой можно пользоваться как через браузер, так и с помощью приложения. Но есть и другие способы, например, используя консоль с введением кода или же сервис для графического дизайна.