Коротко о главном
- Nano Banana 2 — новая модель генерации изображений от Google, построенная на базе Gemini 3.1 Flash Image.
- Она сочетает скорость Flash-моделей и возможности профессиональных моделей Pro.
- Nano Banana Pro — более крупная и ранняя модель, созданная на основе Gemini 3 Pro Image.
- В тестах Nano Banana 2 показывает лучшие результаты в большинстве задач: от фотореализма до работы с текстом внутри изображений.
- Новая модель также получила доступ к интернет-данным, что помогает ей точнее работать с актуальной информацией.
- Главный вывод: Nano Banana 2 быстрее, дешевле и при этом во многих случаях качественнее, чем Nano Banana Pro.
Как развиваются модели генерации изображений
Ещё пару лет назад создание картинки по текстовому описанию казалось магией. Сегодня это уже обычный инструмент — как редактор фотографий.
Достаточно написать несколько слов:
«Фотореалистичный портрет рыбака на закате»
— и через несколько секунд нейросеть создаёт изображение.
За последние годы появилось много подобных моделей: от Midjourney до DALL‑E. Но в экосистеме Google активно развиваются собственные решения, построенные на базе семейства Gemini.
Одно из последних обновлений — новая модель Nano Banana 2.
Она пришла на смену предыдущей версии — Nano Banana Pro. На первый взгляд может показаться, что Pro-модель должна быть мощнее. Но на практике всё оказалось немного интереснее.
Разберёмся, в чём между ними разница.
Что такое Nano Banana 2
Nano Banana 2 — это новая модель генерации изображений, созданная на основе Gemini 3.1 Flash Image.
Главная идея Flash-линейки — максимальная скорость и эффективность.
Проще говоря, Google попыталась сделать модель, которая:
- генерирует изображения быстрее
- требует меньше вычислений
- стоит дешевле в использовании
- при этом не уступает по качеству более крупным моделям
И, судя по тестам, у компании это действительно получилось.
Чем отличается Nano Banana Pro
Nano Banana Pro — предыдущая версия модели, основанная на Gemini 3 Pro Image. Она создавалась как более крупная и мощная модель с упором на качество изображений.
Такие модели обычно лучше справляются со сложными сценами, деталями и художественными стилями. Но у них есть и минусы:
- более высокая стоимость
- большая задержка при генерации
- повышенные требования к вычислениям
Именно поэтому Google активно развивает подход дистилляции знаний — когда знания большой модели передаются более компактной.
Nano Banana 2 как раз пример такого подхода.
Тест №1: знание реального мира
Первый тест проверял, умеют ли модели работать с реальной информацией.
Им задали задачу:
«Сгенерировать изображение самого высокого здания в мире и подписать его название».
Самым высоким зданием сегодня считается Бурдж Халифа.
Обе модели справились с задачей. Но Nano Banana 2 показала более аккуратный результат — она правильно подписала здание без лишних элементов.
Nano Banana Pro тоже распознала объект, но добавила ненужный текстовый блок на изображении.
Небольшая деталь, но она показывает важную вещь: новая модель лучше контролирует композицию картинки.
Тест №2: сложная инфографика
Следующая задача оказалась гораздо сложнее.
Моделям предложили создать инфографику о знаменитой уязвимости в Linux — XZ Utils Backdoor, обнаруженной в 2024 году.
Это была серьёзная атака на цепочку поставок программного обеспечения.
Чтобы правильно объяснить её в инфографике, модель должна:
- понимать саму проблему
- выстроить временную линию событий
- структурировать информацию
Nano Banana 2 почти полностью справилась с задачей и создала понятную временную шкалу событий.
Nano Banana Pro тоже сгенерировала инфографику, но она оказалась менее точной.
Тест №3: текст внутри изображений
Это одна из самых сложных задач для нейросетей.
Долгое время AI-модели плохо справлялись с текстом: буквы получались искажёнными или нечитаемыми.
В тесте моделям дали большой текст и попросили создать изображение книги с этим текстом.
Обе модели смогли отобразить текст. Но у Nano Banana 2:
- лучшее расстояние между строками
- более аккуратная структура
- выше читаемость
Фактически новая модель сейчас считается одной из лучших в мире по генерации текста внутри изображений.
Тест №4: выполнение сложных инструкций
Чтобы проверить точность выполнения промптов, моделям дали довольно конкретную задачу.
Нужно было создать изображение, где:
- видны пальцы руки
- бокал вина наполнен до краёв
- настенные часы показывают 7:42
И там обе модели показали ограничения современных AI-генераторов. Они не смогли корректно отобразить часы. Также ни одна из моделей не заполнила бокал полностью.
Но Nano Banana 2 всё же лучше справилась с деталями — например, пальцы руки были видны более корректно.
Тест №5: фотореализм
Далее модели попросили создать изображение:
«Фотореалистичный портрет пожилого рыбака на закате».
Здесь Nano Banana 2 снова оказалась впереди.
Её изображение получилось более реалистичным благодаря деталям кожи, освещению и согласованности окружающей среды.
Проще говоря, картинка выглядела как настоящая фотография, а не как цифровая иллюстрация.
Тест №6: перевод текста внутри изображения
Моделям загрузили английский постер и попросили перевести его на французский, сохранив дизайн.
Это очень сложная задача, модель должна одновременно понять текст, перевести его и встроить перевод в исходное изображение. Зздесь обе модели справились лишь частично.
Они перевели только заголовок, а основной текст остался без изменений. Nano Banana Pro попыталась перевести описание, но не смогла завершить задачу.
Тест №7: стабильность персонажей
Ещё одна важная задача для генераторов изображений — сохранение одного и того же персонажа. Например, если вы создаёте комикс или серию иллюстраций.
Моделям дали фотографию женщины и попросили показать разные эмоции: радость, грусть, удивление, страх и злость.
Nano Banana 2 лучше сохранила лицо персонажа и точнее передала эмоции.
Тест №8: создание аниме-персонажа
Последний тест был творческим.
Моделям предложили создать лист персонажа аниме-самурая с изображением под разными углами.
И здесь Nano Banana 2 снова показала более сильный результат:
- лучше проработанная броня
- более выразительное лицо
- одинаковый персонаж на разных ракурсах
Это важный показатель для художников и дизайнеров.
Почему новая модель оказалась лучше
На первый взгляд странно, что более компактная модель превосходит большую.
Но причина в том, что Google активно использует технологию knowledge distillation — передачу знаний от крупных моделей компактным.
Проще говоря:
- большая модель обучается на огромных данных
- затем её знания «сжимают»
- и передают более быстрой модели
В результате получается система, которая работает быстрее, стоит дешевле, сохраняет большую часть возможностей. И Nano Banana 2 — хороший пример такого подхода.
Какую модель выбрать
Если коротко, на сегодняшний день Nano Banana 2 выглядит более интересным выбором.
Она показывает лучшие результаты в большинстве задач:
- генерация фотореалистичных изображений
- создание инфографики
- работа с текстом внутри картинок
- сохранение персонажей
- дизайн персонажей и иллюстраций
При этом модель работает быстрее и требует меньше ресурсов.
Nano Banana Pro остаётся сильным инструментом, но сейчас она постепенно уступает новой версии.
Итог
Мир генерации изображений развивается очень быстро. Почти каждый год появляются модели, которые делают скачок вперёд.
Nano Banana 2 — один из таких шагов. Она показывает, что будущее AI-моделей не только в увеличении размеров, но и в умной оптимизации.
И, возможно, уже скоро компактные модели смогут делать то, что сегодня под силу только гигантским системам. А для пользователей это означает простую вещь: создавать качественные изображения с помощью нейросетей станет быстрее, дешевле и доступнее для всех.
- Освой нейросеть Perplexity и узнай, как пользоваться функционалом остальных ИИ в одном
- УЧАСТВОВАТЬ ЗА 0 РУБ.
- Расскажем, как получить подписку
- ПОКАЖЕМ, КАК РАЗВЕРНУТЬ МОДЕЛЬ нейросеть DEEPSEEK R1 ПРЯМО НА СВОЁМ КОМПЬЮТЕРЕ



