Если существуют нейросети для генерации контента, должны быть и нейросети, которые ищут то, что сделано с использованием искусственного интеллекта. Зачем это нужно? Потому что сгенерированные ИИ тексты без человеческих правок могут навредить продвижению сайта.
Поговорим о том, как использование нейросетей без человеческой редактуры может навредить приложению, и о программах, позволяющих обнаружить ИИ-контент.
В чем риски?
Делать контент непросто: нужно думать о многих переменных. Это и постоянное создание чего-то нового, и отслеживание реакции со стороны поисковых роботов, и следование правилам поисковых систем, и привлечение качественного трафика. Контент должен быть полезен для людей.
И поскольку создавать его непросто, многие авторы прибегают к ИИ-инструментам.
Ничего плохого в этом нет — мы сами постоянно пишем в блоге о новых инструментах на основе нейросетей. Они позволяют справляться с писательским блоком и боязнью чистого листа, подкидывают интересные идеи, создают анонсы и структурируют будущую статью. В этом смысле нейросети не хуже любых других инструментов для помощи авторам.
С другой стороны, некоторые публикуют тексты и файлы, сгенерированные нейросетью целиком, без фактчекинга и правок. Вот это может нанести сайту вред.
У Google, например, довольно большой список требований к сайту: цитирования, перелинковка, адаптивность дизайна, безопасность, наличие ключевиков и метатегов, длина и читабельность текста, и многое, многое другое.
Поскольку сгенерированного нейросетью контента становилось все больше, сервис Google не мог оставить этот вопрос без ответа. В пресс-релизе «Правила Google Поиска в отношении контента, созданного искусственным интеллектом» от февраля 2023 года говорится, что компания в первую очередь поощряет качество, а способ создания имеет второстепенное значение. Однако сами алгоритмы поиска отсекают некачественный ИИ-контент, потому что направлены в первую очередь на решение проблемы потенциального клиента. Грубо говоря: человек ищет ответ на вопрос. Чем полезнее для него окажется сайт, тем выше он будет ранжирован в поиске. В самом по себе использовании нейросетей ничего такого нет. Это инструмент — и, как любым инструментом, им нужно уметь пользоваться.
Мы рассказываем об этом на бесплатном вебинаре. И даем в подарок список более 600 ИИ-инструментов на все случаи жизни — для зерокодеров, разработчиков и просто заинтересованных в высоких технологиях специалистов!
Инструменты для поиска сгенерированного контента
Если вы, например, обслуживаете сайт или собираете приложение, клиент может прислать вам файлы для размещения. Когда речь идет о проекте под будущее продвижение в поисковых системах, не лишним будет знать, понравится ли сервисам Google присланный текст.
У специалистов, которые «в теме», глаз уже наметан — они распознают созданный искусственным интеллектом контент по характерным фразам, стилю или повторяющимся выражениям. Но не страшно, если наметанности пока нет. Поймать нейросеть можно при помощи других нейросетей.
Writer
Writer — пример такого инструмента. Это платформа, предназначенная для копирайтеров, авторов и редакторов. У нее есть фича исправления грамматических ошибок, она предлагает рекомендации по тону письма, проверку на плагиат и многое другое. И у нее есть собственная нейросеть, в том числе помогающая обнаружить сгенерированный контент.
Нужно просто скопировать документ в окошко или приложить ссылку, а потом нажать на Analyze Text («Проанализировать текст»). Сканер выдаст процент вероятности того, что текст сгенерирована нейросеть.
Writer использует API для проверки статей, так что они ограничены документом в 1500 символов. Но этого должно хватить.
Так детектор от Writer отреагировал на созданную в ChatGPT статью о зеркодинге — признал ее написанной человеком с вероятностью в 24% и посоветовал отредактировать.
Copyleaks
В отличие от Writer, сканер Copyleaks создан прицельно для «ловли» сгенерированного нейросетью контента. Он определяет то, что было создано с использованием таких инструментов как ChatGPT и GPT-3, а также написанные нейросетью и отредактированные человеком статьи. Платная версия платформы поддерживает русский язык. И у него есть расширение для браузера!
Copyleaks тоже посчитал наш текст сгенерированным — и правильно сделал:
И пусть это не полноценный «помощник копирайтера», у Copyleaks есть другие полезные функции. Например, AI Grader — инструмент, специально сделанный для того, чтобы учителя и преподаватели проверяли задания учащихся на наличие в них сгенерированного контента.
Пока Copyleaks находится на стадии бета-тестирования, но его уже оценили многие крупные организации.
Content at Scale
Content at Scale позиционирует свой детектор ИИ как уникальный — в дополнение к «помощнику автора». Использовать инструмент можно и для генерации, и для определения вероятности, что генерация случилась.
Вердикт платформа выдает за секунды, а еще, как и Writer, показывает в процентном соотношении вероятность того, что статья была сгенерирована нейросетью. В этом он опирается на три параметра: predictability, или предсказуемость, probability, или вероятность, и pattern, или паттерн. Как известно, паттерны — именно то, что лучше всего умеет имитировать искусственный интеллект, и на чем его проще всего поймать.
Таким образом сканер Content at Scale определяет, почему статья выглядит сгенерированной. Например, уже упомянутая выше статья о зерокодинге получила такие статы:
Originality.AI
Originality.AI — дополнение для браузера, у которого есть одна выделяющая его на фоне аналогов фича: он может в режиме реального времени распознать сгенерированный ИИ документ и сразу об этом сообщать. Не нужно ничего копировать и вставлять, дополнение сделает все само. И быстро: высокая скорость — одно из преимуществ, о котором отзываются пользователи.
Недостаток — инструмент платный. Обойдется он в $0,01 за каждые 100 слов.
GPT Zero
GPT Zero создавался для учителей и преподавателей, но разработчику и владельцу сайта он тоже подойдет. Это один из самых популярных детекторов сгенерированного контента — быстрый, простой в использовании и довольно «умный», со способностью узнавать тексты GPT-3, GPT-4, Bard и других нейросетей. Здесь тоже есть поддержка русского языка.
В его простоте заключается и недостаток: больше ни для чего его использовать не получится.
Нейросети — это круто! Они сильно упрощают жизнь, помогают автоматизировать рутинные задачи и в целом являются лучшим другом зерокодера. Но пользоваться ими тоже нужно грамотно, иначе вмешательство программы скорее навредит работе, чем принесет пользу.