Недавно в интернете разошелся «дубляж» русскоязычных мемов, сделанный при помощи платформы HeyGen. Нейросеть с поразительной точностью справилась с переозвучкой таких культовых для русскоговорящего человека видеороликов как «Борщ с капусткой, но не красный», про «кандибобер на голове» и других, имитируя даже голос оригинальных героев. Посмотреть на примеры локализованных мемов можно, например, по ссылке.

HeyGen — это нейросеть, которая сначала транскрибирует текст, потом переводит его, а затем переозвучивает, максимально приближая звучание сгенерированного голоса к оригиналу. Она даже синхронизирует текст с движениями губ героя — это то, что важно для локализации фильмов и игр, чтобы переведенное видео смотрелось максимально органично.

Инструмент всколыхнул общественность, потому что появление таких нейросетей может означать революцию в деле локализации контента, в том числе и игр. Давайте разбираться, как возможности искусственного интеллекта используют в гейм-индустрии уже сейчас, и что пока мешает перевести машинным способом игры на все языки в мире.

Что представляет из себя локализация игр?

Сначала немного терминологии. Локализацией называется масштабный процесс подготовки игры к продаже в новом регионе. В первую очередь это перевод игровых файлов, начиная от интерфейса и заканчивая диалогами, во вторую — анализ нового рынка с целью, например, убрать из оригинальной игры то, что в новом регионе считается незаконным или неэтичным. Могут изменить название, чтобы оно было более привлекательным для игроков из конкретной страны.

И наконец, озвучка. Сейчас локализация не эквивалентна полной переозвучке игры — это дорого, долго и имеет смысл только в ситуации, если маркетинговый отдел ожидает большую прибыль от региона. Часто в рамках локализации делают два-три языковых пакета, а для остальных регионов готовят перевод интерфейса и субтитры.

С такими инструментами как DeepL и HeyGen локализация игр может стать проще и дешевле — и возможно, даже делать полный дубляж станет довольно недорого. Так что посмотрим, что уже сделано в этой области.

Простые геймеры: XUnity.AutoTranslator

Если в мире появляется нейросеть, то сразу же находятся разработчики, которые создают с ее помощью моды для игр. Если существует такая вещь как DeepL, найдется и специалист, который создаст на ее основе автоматический внутриигровой переводчик.

XUnity.AutoTranslator — пример такого переводчика. Это бесплатная программа, которая переведет любые основанные на движке XUnity игры. Она поддерживает разные переводчики, включая основанные на механизмах машинного обучения, в числе которых GoogleTranslate, BingTranslate, DeepLTranslate, BaiduTranslate, YandexTranslate, WatsonTranslate. Новая версия программы позволяет также подключить к системе собственный переводчик.

Пример работы инструмента можно посмотреть на видео:

Это стратегия SpellForce: Conquest of Eo, переведенная XUnity.AutoTranslator на японский язык. Поскольку у современных игр есть склонность к увеличению количества диалогов и описаний, перевод на родной язык действительно поможет игрокам лучше воспринимать внутриигровые тексты.

Работать с нейросетями может каждый: и создавать моды для игр, и внедрять собственные вариации перевода, и использовать их любым другим способом для досуга и труда. Приходите на наш бесплатный вебинар по нейросетям — мы расскажем как.

Крупные игроки: Electronic Arts

Electronic Arts (EA) — один из крупнейших в мире разработчиков и издателей игр. Им принадлежат такие франшизы как Battlefield, Crysis, Dead Space, Dragon Age, FIFA, Mass Effect, Need for Speed, The Sims.

Еще год назад на конференции Data Innovation Summit представительница компании EA Ноэлия Гонсалез рассказала в интервью изданию Hyperight о том, как они используют искусственный интеллект для локализации сотен своих видеоигр. Она отметила, что в процесс перевода игр вовлекаются как люди, так и машины, которые занимаются транскрибированием речи в текст, текста в речь, а также распознаванием изображений.

«Мы переводим игры с английского языка — текст и аудио — на более чем 60 других языков, занимаемся культурной локализацией, — рассказала журналисту Гонсалез. — Использование обработки естественного языка (NLP — то, что лежит в основе языковых моделей, в том числе ChatGPT — примечание «Зерокодера») помогает переводчикам.

В процессе локализации мы обрабатываем огромные объемы текстовой информации. NLP дает возможность ускорить и улучшить ту работу, которую раньше могли выполнять только люди. С использованием NLP мы можем решать такие задачи как перевод, извлечение отношений, анализ настроений и классификация активов по темам».

Профессиональные локализаторы: Alocai

Alocai поставляет инструменты для локализации — от рабочего пространства для всей команды до машинного перевода, в том числе с использованием языковой модели GPT.

О своем новом продукте команда разработчиков написала так:

«Alocai — это комплексная платформа для локализации игр, объединяющая творческий потенциал человека и искусственный интеллект для создания превосходного игрового опыта».

На счету локализаторов — более 5500 переведенных игр, и они не отказываются от человеческой супервизии совсем, просто полагают, что искусственный интеллект способен нивелировать рутину, ускорить и удешевить базовые задачи.

Команда работала над локализацией таких игр как Dead by Daylight, ремастером Final Fantasy VII, Neverwinter, Candy Crush, Diablo IV. Так что будущее намного ближе, чем кажется.

Плюсы и минусы

Про плюсы понятно — нейросети делают процесс локализации видеоигр быстрее и дешевле. С помощью искусственного интеллекта, который обучается на данных и запоминает все решения, перевод можно сделать максимально последовательным, так что разные работающие над текстом команды не будут переводить одно и то же слово по-разному. Некоторые исследователи утверждают, что нейросети способны сделать перевод максимально аккуратным, но в случае с видеоиграми это скорее неправда.

И вот почему:

  • люди лучше понимают контекст — это момент, с которым нейросети с каждым днем справляются все лучше, но по-прежнему не идеально. Они не всегда правильно переводят идиоматические выражения, не понимают иронию и сарказм;
  • люди лучше понимают культурные нюансы, а это очень важно, когда речь идет о настолько деликатной вещи как локализация игры для совершенно иного региона. Есть множество мелочей, которые легко приведут к скандалу, и знать о которых может только человек;
  • люди могут быть экспертами, а нейросеть — нет. Конечно, ее можно обучить на больших объемах данных, но сравниться в экспертизе с настоящим лингвистом или культурологом она не сможет, как и, например, поставить диагноз с учетом многих переменных.

Будущее локализации видеоигр — в коллаборативной работе человека и машины. Это правдиво для многих сфер: роботы не заменят человека, а помогут, убрав скучную рутину и позволив своим органическим коллегам сосредоточиться на творческой части.