Определить при помощи программ, является ли творчеством искусственного интеллекта текст, проще, чем распознать картинку. Поэтому инструментов для 5 инструментов для распознавания сгенерированного текста пока больше, чем визуальных детекторов. Зато у сгенерированных картинок есть особенности, которые начинают бросаться в глаза, стоит приобрести хотя бы небольшую насмотренность.
Поговорим обо всем: о нейросетях, которые помогут определить сгенерированные изображения, и о «косяках», по которым ИИ легко отличить от настоящего художника.
А о том как и для чего использовать генерацию картинок в Midjourney, мы рассказываем на нашем бесплатном практикуме. В прямом эфире будем создавать дизайн сайта, мобильного приложения и генерировать картинки по вашим запросам.
Инструменты для поиска сгенерированных изображений
Maybe’s AI Art Detector от HuggingFace
HuggingFace — это сообщество людей, увлеченных машинным обучением. Ребята создают модели, датасеты и многое другое, причем по принципу Github: это именно комьюнити, где все делятся наработками и идеями. Их специализация — языковые модели-трансформеры, то есть та самая штука, которая лежит в основе ChatGPT. Но с изображениями они тоже работают — и даже представили первый инструмент, использующий мощности нейросетей для поиска следов ИИ в, на первый взгляд, невинной картинке.
Чтобы протестировать возможности Maybe’s AI Art Detector, возьмем созданную в Midjourney картину Théâtre D’opéra Spatial. Возможно, вы про нее слышали. В 2022 году Джейсон Аллен получил за нее первое место в цифровой категории на ярмарке штата Колорадо.
Вот эта картина:
И вот что думает о ней Maybe’s AI Art Detector. Вероятность того, что ее создала нейросеть, — 87%.
AI-Generated Media Recognition API от Hive
Hive — нейросеть-модератор. Она использует возможности машинного обучения для того, чтобы идентифицировать определенный контент: находит в чатах нецензурную ругань, обнаруживает эротику или порнографию, в том числе визуальную, а потом помечает нарушителей, чтобы впоследствии с ними разобрались модераторы-люди. И она тоже может обнаруживать сгенерированные нейросетью картинки.
Картину Théâtre D’opéra Spatial инструмент от Hive безошибочно опознал как сгенерированную. И даже указал, что создана она была на Midjourney.
About this image от Google
About this image буквально переводится как «Об этой картинке». Впервые инструмент был представлен на конференции Google I/O 2023. По словам разработчиков, он поможет более ответственно использовать нейросети.
Работает инструмент не через нейросеть, а через идентификацию важного контекста:
- когда картинку впервые проиндексировал Google;
- где она впервые появилась;
- где она еще встречается — например, в социальных сетях.
Пока фича находится в бета-тестировании, но разработчики обещают скоро выпустить ее для всех.
Были и другие — например, детектор GAN detector от Mayachitra, разработанный в 2021 году. Он определял, был ли использован при создании картинки алгоритм GAN — генеративно-состязательная сеть. Однако на май 2023 года инструмент недоступен.
Как определить сгенерированную картинку на глаз
ИИ-картинка — это не ИИ-текст, ее не нужно читать, чтобы понять, участвовала ли нейросеть в ее создании. Пока творчество нейросетей неидеально, особенно если после генерации по ней не прошелся кистью художник.
Поэтому вот несколько советов, как определить, создана ли картинка нейросетью.
1. Проверьте название, описание и комментарии
Не все ИИ-художники делают вид, что рисовали картинку с нуля, и не все выдают себя за фотографов. ИИ-арт — вполне легитимное направление. Иногда ИИ-художники даже делятся промтом — запросом, позволившим им создать рисунок. А если очевидных указаний на инструмент нет, возможно, они найдутся в комментариях.
2. Поищите вотермарк
Вотермарк — это подпись. Она может принадлежать художнику, может принадлежать и нейросети. К примеру, DALL·E прибавляет к сгенерированным картинкам полоску с цветными квадратами в нижнем правом углу.
3. Поищите странности
Теперь придется подключить внимательность. Всем известна проблема, которая возникает у искусственного интеллекта с пальцами: нейросети никак не могут запомнить, сколько их должно быть у человека. Нередко на сгенерированных изображениях очки и другие аксессуары «сплавляются» с лицом человека, появляются посторонние руки в области талии, надписи становятся нечитаемыми, кожа приобретает странный матовый блеск. И порой у героев ИИ-фотосъемки слишком много зубов.
Если речь идет о картинках, то чаще всего нейросеть не справляется с руками (слишком много или мало пальцев, общие странности с анатомией), глазами (не анатомично растущие ресницы, глаза разного размера, нет бликов), волосами. ИИ-изображения очень реалистичны и детальны, но при этом «художник» допускает ошибки, которые не допустил бы и первокурсник художки.
Общее для картинок и фотографий: странный замыленный фон, иногда на нем видны другие люди, сгенерированные намного хуже, чем «главный герой».
Главное в задаче «ручного» определения сгенерированных картинок — насмотренность. Чем дольше вы будете смотреть на такое изображение, тем больше странностей заметите.