Определить при помощи программ, является ли творчеством искусственного интеллекта текст, проще, чем распознать картинку. Поэтому инструментов для 5 инструментов для распознавания сгенерированного текста пока больше, чем визуальных детекторов. Зато у сгенерированных картинок есть особенности, которые начинают бросаться в глаза, стоит приобрести хотя бы небольшую насмотренность.

Поговорим обо всем: о нейросетях, которые помогут определить сгенерированные изображения, и о «косяках», по которым ИИ легко отличить от настоящего художника.

А о том как и для чего использовать генерацию картинок в Midjourney, мы рассказываем на нашем бесплатном практикуме. В прямом эфире будем создавать дизайн сайта, мобильного приложения и генерировать картинки по вашим запросам.

Инструменты для поиска сгенерированных изображений

Maybe’s AI Art Detector от HuggingFace

HuggingFace — это сообщество людей, увлеченных машинным обучением. Ребята создают модели, датасеты и многое другое, причем по принципу Github: это именно комьюнити, где все делятся наработками и идеями. Их специализация — языковые модели-трансформеры, то есть та самая штука, которая лежит в основе ChatGPT. Но с изображениями они тоже работают — и даже представили первый инструмент, использующий мощности нейросетей для поиска следов ИИ в, на первый взгляд, невинной картинке.

Чтобы протестировать возможности Maybe’s AI Art Detector, возьмем созданную в Midjourney картину Théâtre D’opéra Spatial. Возможно, вы про нее слышали. В 2022 году Джейсон Аллен получил за нее первое место в цифровой категории на ярмарке штата Колорадо.

Вот эта картина:

И вот что думает о ней Maybe’s AI Art Detector. Вероятность того, что ее создала нейросеть, — 87%.

AI-Generated Media Recognition API от Hive

Hive — нейросеть-модератор. Она использует возможности машинного обучения для того, чтобы идентифицировать определенный контент: находит в чатах нецензурную ругань, обнаруживает эротику или порнографию, в том числе визуальную, а потом помечает нарушителей, чтобы впоследствии с ними разобрались модераторы-люди. И она тоже может обнаруживать сгенерированные нейросетью картинки.

Картину Théâtre D’opéra Spatial инструмент от Hive безошибочно опознал как сгенерированную. И даже указал, что создана она была на Midjourney.

About this image от Google

About this image буквально переводится как «Об этой картинке». Впервые инструмент был представлен на конференции Google I/O 2023. По словам разработчиков, он поможет более ответственно использовать нейросети.

Работает инструмент не через нейросеть, а через идентификацию важного контекста:

  • когда картинку впервые проиндексировал Google;
  • где она впервые появилась;
  • где она еще встречается — например, в социальных сетях.

Пока фича находится в бета-тестировании, но разработчики обещают скоро выпустить ее для всех.

Были и другие — например, детектор GAN detector от Mayachitra, разработанный в 2021 году. Он определял, был ли использован при создании картинки алгоритм GAN — генеративно-состязательная сеть. Однако на май 2023 года инструмент недоступен.

Как определить сгенерированную картинку на глаз

ИИ-картинка — это не ИИ-текст, ее не нужно читать, чтобы понять, участвовала ли нейросеть в ее создании. Пока творчество нейросетей неидеально, особенно если после генерации по ней не прошелся кистью художник.

Поэтому вот несколько советов, как определить, создана ли картинка нейросетью.

1. Проверьте название, описание и комментарии

Не все ИИ-художники делают вид, что рисовали картинку с нуля, и не все выдают себя за фотографов. ИИ-арт — вполне легитимное направление. Иногда ИИ-художники даже делятся промтом — запросом, позволившим им создать рисунок. А если очевидных указаний на инструмент нет, возможно, они найдутся в комментариях.

2. Поищите вотермарк

Вотермарк — это подпись. Она может принадлежать художнику, может принадлежать и нейросети. К примеру, DALL·E прибавляет к сгенерированным картинкам полоску с цветными квадратами в нижнем правом углу.

3. Поищите странности

Теперь придется подключить внимательность. Всем известна проблема, которая возникает у искусственного интеллекта с пальцами: нейросети никак не могут запомнить, сколько их должно быть у человека. Нередко на сгенерированных изображениях очки и другие аксессуары «сплавляются» с лицом человека, появляются посторонние руки в области талии, надписи становятся нечитаемыми, кожа приобретает странный матовый блеск. И порой у героев ИИ-фотосъемки слишком много зубов.

Если речь идет о картинках, то чаще всего нейросеть не справляется с руками (слишком много или мало пальцев, общие странности с анатомией), глазами (не анатомично растущие ресницы, глаза разного размера, нет бликов), волосами. ИИ-изображения очень реалистичны и детальны, но при этом «художник» допускает ошибки, которые не допустил бы и первокурсник художки.

Общее для картинок и фотографий: странный замыленный фон, иногда на нем видны другие люди, сгенерированные намного хуже, чем «главный герой».

Главное в задаче «ручного» определения сгенерированных картинок — насмотренность. Чем дольше вы будете смотреть на такое изображение, тем больше странностей заметите.