Сегодня совместим ChatGPT и MidJorney. Обсудим нейросети, как обучить одну для работы с другой. Что можно получить на выходе и как правильно все использовать.

Обзор ChatGPT

ChatGPT — это нейросеть, разработанная OpenAI для ведения диалогов и общения с людьми. Она основана на архитектуре GPT (Generative Pre-trained Transformer) и представляет собой виртуального чат-бота, который может отвечать на вопросы, задавать уточняющие вопросы и общаться на естественном языке. Он обучен на огромном объеме текстовых данных, что позволяет ему генерировать осмысленные и связные ответы.

О MidJorney

MidJorney – это еще одна нейросеть, разработанная одноименным исследовательским сообществом, однако тут фокус на обработку изображений и создание впечатляющих визуальных путешествий. Она обучена анализировать и понимать содержимое изображений, включая объекты, сцены и контекст, и создавать описательные и креативные тексты, соответствующие визуальным впечатлениям.

Что можно получить от ChatGPT и MidJorney вместе

Представьте себе, что происходит, когда эти две нейросети работают вместе. ChatGPT, способный генерировать качественные тексты, и MidJorney, способный анализировать и интерпретировать изображения, создают синергию, которая расширяет возможности искусственного интеллекта на новый уровень.

Совмещение ChatGPT и MidJorney позволяет создавать потрясающие визуальные путешествия, в которых текст и изображения взаимодействуют друг с другом. Например, вы можете задать вопрос о пейзаже, и ChatGPT создаст описательное и живое описание на основе информации, полученной от MidJorney об изображении этого пейзажа.

Обучаем ChatGPT

Перед тем, как использовать эту нейросеть для генерации промтов (запросов) под вторую, сначала нужно научить Чат генерировать запросы. Для начала обучим нейросеть по формуле. Для генерации максимально фотореалистичных изображений подойдет запрос:

Here is a Midjourney Prompt Formule: (image we’re prompting), (5 descriptive keywords), (camera type), (camera lens type), (time of day), (style og photograph), (type of film) When you make up a prompt, you have to write it on one line. There is no need to break it up into parts, also write the whole sample with commas. Please respond with «yes» if you understand the formula

Здесь мы объясняем Чату, как создавать запросы для Миджорни, а также просим обратную связь. Копируем этот текст в диалог с ботом, на что он дает понимающий ответ. Если нужна более мультяшная стилистика, переучим модель по следующему промту:

Here is a Midjourney Prompt Formule:

(subject of image), in the style of (name of cartoon), (5 adjectives), (verb that subject is perfoming)

When you make up a prompt, you have to write it on one line. There is no need to break it up into parts, also write the whole sample with commas. Please respond with «yes» if you understand the formula

Примеры использования совмещенной системы

Давайте рассмотрим несколько примеров использования совмещенной системы ChatGPT и MidJorney. Вы можете отправить изображение природного пейзажа и спросить ChatGPT: «Какие слова лучше всего описывают это изображение?». В ответ вы получите красочное и детальное описание природы, которое будет захватывающим и увлекательным.

Еще один пример — вы отправляете изображение птицы и спрашиваете ChatGPT: «Какие факты о птицах можно узнать из этого изображения?». ChatGPT может ответить, предоставляя интересные сведения о виде птицы, ее особенностях и местах обитания.

Но рассмотрим и обратное взаимодействие. Например, вы можете спросить у текстовой нейросети сгенерировать несколько промтов под пейзажи разной стилистики. И он сделает это, исходя из формул, которые он выучил ранее.

Например, попросим его сгенерировать несколько промтов под главного героя 2д игры. Напишем: Write me 5 Midjourney promts for main character 2d videogame. И получим:

Sure! Here are five Midjourney prompts for the main character of a 2D video game:

  • Brave knight, in the style of «Super Mario,» determined, courageous, agile, battling enemies.
  • Clever wizard, in the style of «The Legend of Zelda,» wise, mystical, resourceful, casting powerful spells.
  • Stealthy ninja, in the style of «Shinobi,» agile, shadowy, swift, executing stealthy maneuvers.
  • Fearless space explorer, in the style of «Metroid,» adventurous, futuristic, resilient, exploring alien worlds.
  • Playful anthropomorphic animal, in the style of «Sonic the Hedgehog,» energetic, speedy, mischievous, collecting rings and power-ups.

Останется только каждый запрос “скормить” Миджорни и наслаждаться результатом.

Заключение

Друзья, сегодня мы рассмотрели захватывающее сочетание ChatGPT и MidJorney, которое позволяет нам погрузиться в удивительные путешествия в мир искусственного интеллекта. ChatGPT с его способностью генерировать качественные тексты, а MidJorney с его умением анализировать изображения создают поистине уникальный опыт.