Google выпустила Nano Banana 2: как нейросеть создает картинки за секунды

Генерация картинок с помощью нейросетей за последние пару лет стала чем-то привычным — примерно как калькулятор на телефоне. Но скорость и качество результата по-прежнему заставляют выбирать: либо быстро но так себе, либо долго но красиво. Google решила, что пора перестать выбирать, и выпустила Nano Banana 2 — модель, которая генерирует изображения студийного качества в 4K-разрешении практически мгновенно.

Новую нейросеть Nano Banana 2 стоит попробовать всем

Что такое Nano Banana 2

Начнем с главного вопроса, который мучает многих: при чем тут банан? На самом деле, Google давно использует причудливые внутренние кодовые названия для своих проектов, и Nano Banana — не исключение. Это семейство компактных моделей для генерации изображений, построенных на архитектуре Gemini Flash.

Первая версия Nano Banana уже умела создавать картинки приличного качества, но у нее были ограничения: относительно невысокое разрешение и заметная задержка при обработке сложных промптов. Nano Banana 2 — это полноценное второе поколение, в котором инженеры Google переработали архитектуру модели с нуля.

Главная фишка — поддержка генерации в разрешении до 4K, что раньше было прерогативой тяжелых моделей уровня DALL-E 3 или Midjourney в максимальных режимах. При этом Nano Banana 2 работает значительно быстрее конкурентов. Для сравнения, генерация одного изображения в 4K у Midjourney занимает около 30–60 секунд, тогда как новая модель Google укладывается в несколько секунд.

Нейросеть NAno Banana 2 обрабатывает фотографии за несколько секунд. Источник изображения: blog.google

Как работает нейросеть Nano Banana 2

Секрет кроется в архитектуре Gemini Flash — облегченной версии большой модели Gemini, которую Google оптимизировала специально для задач, требующих минимальной задержки. Если обычные генеративные модели работают по принципу «сначала думаем, потом рисуем», то Nano Banana 2 использует так называемую потоковую генерацию. Проще говоря, модель начинает выстраивать изображение еще до того, как полностью обработает текстовый запрос.

Кроме того, инженеры применили технику дистилляции знаний (Knowledge distillation) — когда большая, «тяжелая» модель обучает маленькую воспроизводить свои результаты. Nano Banana 2 фактически «выучила» качество генерации от старшей модели Gemini, но при этом сохранила компактный размер и высокую скорость работы. Это означает, что запускать ее можно не только на мощных серверах, но и на относительно скромном оборудовании.

Оказывается, ключевым прорывом стала оптимизация работы с латентным пространством — той самой математической «карте», в которой нейросеть хранит представления о визуальных объектах. Nano Banana 2 перемещается по этому пространству значительно эффективнее предшественников, что и дает прирост в скорости без потери детализации.

Nano Banana 2 предлагает сразу выбрать стиль изображения

Чем Nano Banana 2 лучше аналогов

На рынке генеративных моделей сейчас тесно: Midjourney, DALL-E 3, Stable Diffusion, Ideogram и еще десяток конкурентов. Казалось бы, зачем Google нужна еще одна модель?

Большинство популярных генераторов изображений — это отдельные продукты, живущие в собственных экосистемах. Midjourney работает через Discord, DALL-E встроен в ChatGPT. Nano Banana 2 же интегрирована напрямую в экосистему Google — от поисковика до Workspace и Android. Это значит, что генерация изображений может стать такой же базовой функцией, как проверка орфографии.

По качеству картинки Nano Banana 2 уже сопоставима с лидерами рынка. Модель особенно хорошо справляется с фотореалистичными портретами, продуктовой съемкой и архитектурными визуализациями. А вот в стилизации под живопись или аниме она пока уступает Midjourney, но Google обещает закрыть этот разрыв в ближайших обновлениях.

Впрочем, главное преимущество не в качестве отдельных картинок, а в скорости и масштабируемости. Для бизнеса, которому нужно генерировать сотни изображений в час (например, для карточек товаров в интернет-магазине), разница между 5 секундами и минутой на картинку — это не мелочь, а вопрос экономики.

Эту картинку Nano Banana 2 создал за пять секунд

Для чего нужна нейросеть Nano Banana 2

Google позиционирует Nano Banana 2 в первую очередь как инструмент для разработчиков и бизнеса. Доступ к модели будет предоставляться через API Vertex AI, а значит, любой сервис сможет встроить генерацию студийных изображений в свой продукт. Для обычных пользователей модель уже работает в чат-боте Gemini и Google AI Studio.

Интересно, что Google делает ставку и на безопасность контента. В Nano Banana 2 встроена система водяных знаков SynthID, которая незаметно маркирует каждое сгенерированное изображение. Это означает, что отличить реальное фото от нейросетевого можно будет программно, даже если на глаз разница не видна.

Чтобы оставаться в курсе новых нейросетей, подпишитесь на наш Telegram-канал. Так вы не пропустите ничего важного!

Рынок генеративного ИИ меняется так быстро, что любое «невозможно» превращается в «уже работает» за пару месяцев. Nano Banana 2 — очередное тому подтверждение: студийное качество, скорость в реальном времени и интеграция в крупнейшую цифровую экосистему мира. Осталось только посмотреть, как ответят конкуренты.

Новости партнеров
Смартфоны Xiaomi официально подорожают — новые цены 2026
Смартфоны Xiaomi официально подорожают — новые цены 2026
Полиция Южной Кореи потеряла конфискованные 22 биткоина. Монеты хранились на ненадёжном кошельке
Полиция Южной Кореи потеряла конфискованные 22 биткоина. Монеты хранились на ненадёжном кошельке
Тени на скриншотах окон в macOS: как убрать и почему это стоит сделать
Тени на скриншотах окон в macOS: как убрать и почему это стоит сделать