В мае 2025 года на конференции Google I/O были представлены два новых инструмента, которые вызвали большой интерес у креативного сообщества: усовершенствованная модель генерации видео Veo 2 и совершенно новая, технологически продвинутая Veo 3.

Если Veo 2 — это надёжный и гибкий помощник для видеомейкеров, работающий в связке с человеком, то Veo 3 — это уже полноценный «соавтор», способный воплотить в кадре не только визуальный замысел, но и звуковую атмосферу.

О том, как делегировать работу нейросетям — рассказываем тут.

Что нового появилось в Veo 2

Модель стала гораздо удобнее для профессионалов благодаря функциям, вдохновлённым реальными запросами режиссёров, аниматоров и видеохудожников.

1. Видео по референсам

Теперь можно «показать» Veo, как должен выглядеть кадр. Загружаете изображения персонажей, объектов, настроения сцены — и модель учитывает эти стилистические референсы при генерации. Это особенно полезно, если вы работаете над серией роликов и хотите сохранить единый визуальный стиль или внешний вид героев.

2. Управление камерой

Интерфейс позволяет точно настраивать движения камеры: повороты, наезды, отъезды, панорамирование. Например, если вам нужно смоделировать сцену, где камера медленно приближается к главному герою, а затем делает круговой объезд — Veo 2 справится.

3. Outpainting — расширение кадра

Если у вас вертикальное видео, но нужно сделать горизонтальную версию для другого формата (например, для YouTube), модель сама достраивает недостающие элементы сцены. Причём делает это логично: добавляет тени, фоновые объекты, соблюдает перспективу.

4. Добавление и удаление объектов

Сцене не хватает автомобиля на заднем плане? Или наоборот — нужно убрать случайного прохожего? Veo 2 понимает масштаб, свет, взаимодействие с окружением и корректно вписывает или удаляет элементы. Это не просто стирание фрагментов, а интеллектуальная работа с композицией.

Часть этих функций уже доступна в продукте Flow, а в ближайшие недели они появятся в Vertex AI API. Google активно внедряет эти возможности и в другие продукты для разработчиков и креативных студий.

ОНЛАЙН-ПРАКТИКУМ
ЗАПУСК DEEPSEEK R1 ЛОКАЛЬНО НА СВОЕМ КОМПЬЮТЕРЕ
ЧТО БУДЕТ НА ОБУЧЕНИИ?
  • ПОКАЖЕМ, КАК РАЗВЕРНУТЬ МОДЕЛЬ DEEPSEEK R1 ПРЯМО НА СВОЁМ КОМПЬЮТЕРЕ
  • Где и как применять? Потестируем модель после установки на разных задачах
  • Как дообучить модель под себя?

Veo 3: когда видео начинает «звучать»

Главная новинка, которую Veo 3 привносит в процесс создания видео — это аудио. Впервые генеративная модель от Google способна не просто визуализировать сюжет, но и наполнить его звуковой атмосферой.

Veo 3 создаёт звуки, соответствующие происходящему в кадре. Например, в сцене городского перекрёстка вы услышите гул машин, шаги, фоновый шум и даже обрывки диалогов. В парковой сцене — шелест листвы, щебет птиц, лай собаки на фоне.

Особое внимание уделено синхронизации речи и движений губ. Персонажи в Veo 3 не просто «открывают рот», как в старых видеоиграх, а говорят с реалистичной артикуляцией. Это открывает большие перспективы для анимации и даже образовательного контента.

Вы можете задать короткое описание сцены — и модель создаст видеоклип, в котором будут переданы как события, так и настроение. Например: «Мальчик бежит по мокрой улице, вдалеке слышен гром, камера приближается к его лицу, когда он оборачивается» — и результат вас удивит.

Тени, отражения, движение тканей и воды — всё это стало заметно реалистичнее. Модель обучена учитывать законы реального мира при генерации визуала, особенно в динамичных сценах.

На данный момент модель доступна пользователям Ultra-подписки в США через приложение Gemini, а также в корпоративных решениях на платформе Vertex AI. В инструменте Flow она также активно внедряется, особенно среди продвинутых пользователей.

Что это значит для будущего креатива

Теперь для создания короткометражки или рекламного ролика не нужно дорогое оборудование, актёры, съёмочная группа или монтажёры. Всё это может быть реализовано с помощью текста, нескольких референсов и пары кликов.

Но стоит помнить, что ИИ пока не умеет полностью заменить человека. Он не чувствует и не понимает контекста так, как это делает живой режиссёр. Есть примеры, когда Veo 3 генерировала странные сцены с неестественным поведением объектов или неудачной звуковой композицией.

РОССИЙСКИЕ НЕЙРОСЕТИ ДЛЯ ЖИЗНИ И КАРЬЕРЫ В 2025
Присоединяйся к онлайн-вебинару.
В прямом эфире разберем и потестируем лучшие на сегодняшний день отечественные ИИ!
Вы узнаете о том:
  • Выполним базовые задачи на российских нейросетях и посмотрим на результаты!
  • PDF-инструкцию «Как сделать нейрофотосессию из своего фото бесплатно, без иностранных карт и прочих сложностей»
  • Покажем 10+ способов улучшить свою жизнь с ИИ каждому — от ребенка и пенсионера до управленца и предпринимателя
Участвовать бесплатно
ОБЗОРНЫЙ ПРАКТИКУМ ПО НАШУМЕВШИМ НЕЙРОСЕТЯМ
DEEPSEEK И QWEN
За 2 часа сделаем полный обзор новых мощных AI-моделей, которые бросают вызов ChatGPT
Вы узнаете:
  • Возможность получить Доступ в Нейроклуб на целый месяц
  • Как AI ускоряет работу и приносит деньги
  • За 2 часа вы получите четкий план, как начать работать с AI прямо сейчас!
Участвовать бесплатно