Попробовать создать что-нибудь в Kandinsky можно на платформе Fusion Brain или в официальном телеграм-боте. Удобнее всего пользоваться ботом — он бесплатный и реагирует на запросы довольно быстро. Но важно не ошибиться и не стать жертвой мошенников, так что пользуйтесь только официальной версией.

О чем речь

Kandinsky — это нейросеть на русском языке от Сбера. Она генерирует изображения и другой контент по текстовым промтам, специализируясь на фотореализме, в отличие от того же Midjourney, в первую очередь прославившегося мультяшными картинками.

Это диффузная нейросеть, которая сначала «зашумливает» изображение, превращая его в аналог серого экрана телевизора, а затем восстанавливает. В блоге Сбера на «Хабре» довольно подробно объясняется принцип работы диффузных нейросетей в целом и Kandinsky в частности.

Мы поговорим о функционале — что Kandinsky умеет, как им пользоваться, и какие у него преимущества. Если же вам интересны другие нейросети, приходите на бесплатный онлайн-практикум от «Зерокодера». Обсудим самые популярные платформы для генерации картинок и текста, научимся ими пользоваться и узнаем, как применять свои знания в жизни!

Особенности и характеристики

На момент написания статьи пользователям доступна уже третья версия Kandinsky 3.0, вышедшая в ноябре 2023 года. Однако, учитывая темпы развития нейросети, вполне возможно, что уже в ближайшие месяцы разработчики выпустят что-нибудь новое.

Что умеет Kandinsky? Помимо генерации картинок по текстовому промту, или запросу, нейросеть от Сбера умеет кое-что еще, а именно:

  • смешивать изображения — создавать картинку по мотивам двух, как бы соединяя их;
  • изменять стили — опять же, можно загрузить изображение и попросить изменить стиль;
  • дорисовывать — делать outpainting. Если у картинки, например, нет фона, нейросеть его дорисует;
  • переносить позы и другие элементы — скажем, если вам нужна поза персонажа с одной картинки, вы можете перенести ее на другую картинку в Kandinsky;
  • создание коротких гифок, которые потом можно скрепить в видеоролик. Гифки длятся по четыре секунды.

Помимо перечисленных фич, которые были доступны в ранних версиях нейросети, команда Kandinsky также представила функцию Inpainting — это когда искусственный интеллект работает над каким-то конкретным участком изображения. Выглядит это примерно так:

В третьей версии нейросети было улучшено понимание традиционной русской культуры, искусственный интеллект получил возможность генерировать более качественный фотореализм. Если нужно сделать что-то «под хохлому», то у Kandinsky есть для этого подготовленные и обученные модели.

Как работать с Kandinsky

Рабочее поле в Fusion Brain выглядит так:

Помимо поля для промта — текстового запроса — здесь есть еще и поле «негативный промт», куда по желанию можно вписать то, чего на итоговом изображении точно быть не должно. Нейросеть понимает около сотни языков, мультиязычность разработчики называют одним из главных преимуществ Kandinsky. Поэтому писать промт можно практически на любом языке, включая русский.

 

С помощью инструмента «ластик» есть возможность улучшить картинку — например, изменить окраску котика:

Работать с нейросетью в целом несложно: пишем запрос естественным языком, выбираем стиль, если нужно — исключаем какие-то элементы во вкладке «негативный промт».

Плюсы и минусы

Главное достоинство Kandinsky — в том, как хорошо он понимает тексты на русском языке. Интерфейс у него тоже полностью русифицирован, так что не нужно ни пользоваться браузерными переводчиками, ни переводить промт в надежде, что так искусственный интеллект поймет его лучше.

С появлением третьей версии нейросеть начала хорошо работать с изображениями, так или иначе связанными с русской культурой. Есть возможность генерировать картинки в разных стилях, перерисовывать отдельные элементы изображения, дополнять срезанные части иллюстрации, как бы расширяя ее. При желании в телеграм-боте можно даже создать стикерпак.

Из недостатков — с деталями у Kandinsky похуже, чем у аналогов. А для создания разных видео придется учитывать массу нюансов, таких как морфинг и повороты камеры, постоянно переписывать текст промта. Но если попрактиковаться, с помощью инструмента вполне можно делать короткие ролики для социальных сетей.

Подводя итог: Kandinsky от Сбера — отличная нейросеть для своих целей. Она бесплатна и полностью доступна россиянам, прекрасно понимает русский язык.