Генератор изображений ChatGPT обновился: что умеет, как пользоваться и примеры картинок

Рамис Ганиев

Компания OpenAI выпустила ChatGPT Images 2.0. Это крупнейшее обновление системы генерации изображений со времен самой первой версии ChatGPT. Новая модель не просто рисует картинки по описанию, а сначала «думает», может искать информацию в интернете и выдает результат в разрешении до 2K. Релиз состоялся 21 апреля 2026 года и доступен всем пользователям ChatGPT, даже бесплатным.

Новый ChatGPT Images 2.0 умеет генерировать людей, скриншоты и тексты (с последними, как видно, есть проблемы). Фото.

Новый ChatGPT Images 2.0 умеет генерировать людей, скриншоты и тексты (с последними, как видно, есть проблемы)

Режимы создания картинок ChatGPT Images 2.0

Согласно блогу компании OpenAI, новая модель работает в двух режимах, каждый из которых решает свою задачу. Instant — быстрый режим, заточенный на скорость. Перед запуском OpenAI тестировала его на платформе LMArena под кодовым названием «duct tape». Он выдает качественные изображения за считанные секунды и доступен всем пользователям ChatGPT.

Режим Thinking работает медленнее, но «рассуждает» перед генерацией картинки. Это позволяет ему сохранять согласованность персонажей на нескольких кадрах, искать данные в сети и создавать до восьми изображений за один запрос. Thinking доступен подписчикам Plus, Pro и Business.

Разница между режимами принципиальна. Предыдущие модели генерировали картинку как разовое действие: один запрос — один результат. Thinking превращает создание изображения в структурированный процесс, где модель сначала анализирует задачу, а уже потом рисует. Это открывает двери для создания манги, раскадровок и серий изображений с одними и теми же персонажами. Кстати, можете попробовать нарисовать свое тотемное животное.

Пример своеобразного комикса, созданного ChatGPT Images 2.0. Фото.

Пример своеобразного комикса, созданного ChatGPT Images 2.0

Редактирование фотографий в ChatGPT

Самое заметное изменение заключается в самом подходе к работе с изображениями. OpenAI больше не рассматривает генерацию как одноразовое действие «запрос — ответ». Теперь это диалог.

Пользователь может уточнять изображение в процессе: приближать фрагменты, менять элементы композиции, корректировать стиль — и все это без перезапуска с нуля. Модель помнит контекст предыдущих правок и развивает результат итеративно.

На демонстрации система из одной загруженной фотографии сгенерировала восемь вариантов летних нарядов. В другом примере она проанализировала реакции в соцсетях на предыдущие тестовые модели, визуально обобщила результаты и даже создала QR-код со ссылкой на ChatGPT.

Это показывает главную идею обновления: ChatGPT Images 2.0 объединяет рассуждения, поиск информации и дизайн в единый рабочий цикл. Раньше для этого требовалось несколько разных инструментов.

Восемь разных летних нарядов для одной девушки. Фото.

Восемь разных летних нарядов для одной девушки

Лучшая нейросеть для генерации картинок с текстом

Одна из самых раздражающих проблем всех ИИ-генераторов изображений — нечитаемый текст. Надписи на постерах выглядели как абракадабра, а вывески на сгенерированных улицах напоминали инопланетный алфавит. Images 2.0 пытается решить эту проблему.

Справка от врача, сделанная через ChatGPT. Кажется, наступают времена массовых подделок? Фото.

Справка от врача, сделанная через ChatGPT. Кажется, наступают времена массовых подделок?

OpenAI заявляет о «качественном скачке» в рендеринге текста. Модель теперь справляется с мелким шрифтом, элементами интерфейса, плотными макетами и даже иконографией. По данным компании, читаемая типографика работает даже в сложных композициях вроде обложек журналов и инфографики.

Газета Hi-news в представлении ChatGPT Images 2.0. Фото.

Газета Hi-news в представлении ChatGPT Images 2.0

Улучшилась и поддержка нелатинских алфавитов — японского, корейского, китайского, хинди и бенгальского. Это было давней слабостью генеративных моделей, которые обучались преимущественно на англоязычных данных.

Сообщение от Тима Кука в телеграме. Фото.

Сообщение от Тима Кука в телеграме

Впрочем, идеального результата ждать пока рано. Журналисты, тестировавшие модель в день запуска, отмечали, что с точным воспроизведением логотипов и брендов она все еще ошибается.

Это не скриншот, а изображение, созданное ChatGPT Images 2.0. Фото.

Это не скриншот, а изображение, созданное ChatGPT Images 2.0

Форматы изображений в ChatGPT

С технической стороны Images 2.0 получила несколько важных улучшений. Модель поддерживает гибкие пропорции, от ультраширокого формата 3:1 до ультравертикального 1:3. Это покрывает практически все распространенные форматы:

  • баннеры и презентации;
  • мобильные сторис и вертикальные видеоформаты;
  • постеры и печатные макеты;
  • квадратные публикации для соцсетей.

Максимальное разрешение выросло до 2K, а за один запрос можно получить до восьми изображений. Для разработчиков модель доступна через API под названием gpt-image-2.

Змея в формате 1:3. Фото.

Змея в формате 1:3

ВАЖНО: DALL-E 2 и DALL-E 3, предыдущие модели OpenAI для генерации картинок, будут отключены 12 мая 2026 года. Images 2.0 фактически становится их заменой, хотя построена на совершенно другой архитектуре. Предыдущие версии DALL-E работали как отдельный инструмент, к которому ChatGPT обращался «снаружи». Теперь генерация изображений встроена в саму модель.

Зачем OpenAI делает ставку на генерацию изображений в ChatGPT

Текстовые модели ведущих лабораторий OpenAI, Google и Anthropic постепенно сближаются по качеству. Отличаться только текстом становится все сложнее. OpenAI, судя по этому релизу, рассматривает генерацию изображений как следующее поле конкуренции.

В феврале 2026 года Google выпустила Nano Banana 2 — свою модель с аналогичным подходом, где генератор тоже «думает» перед созданием картинки. OpenAI явно отвечает на этот вызов, добавляя к рассуждениям ещё и интерактивное редактирование.

Для обычного пользователя это значит, что ИИ-генерация изображений выходит из стадии игрушки и начинает превращаться в рабочий инструмент. Маркетологу не нужен дизайнер для быстрого макета баннера. Учитель может создать наглядную схему для урока. Разработчик — набросать прототип интерфейса прямо в среде, где пишет код.

Любой сложный текст можно визуализировать для лучшего восприятия. Фото.

Любой сложный текст можно визуализировать для лучшего восприятия

Но стоит сохранять реалистичные ожидания. Модель все еще может ошибаться в деталях, путать пространственные отношения объектов и выдавать географические неточности. Генерация сложного изображения в Thinking-режиме может занимать до двух минут. А база знаний модели ограничена декабрем 2025 года. Это значит, что все, что произошло после, она не знает без обращения к поиску.

Попробовать новый генератор изображений ChatGPT

Images 2.0 — не волшебная палочка, но значительный шаг к тому, чтобы ИИ стал полноценным визуальным инструментом, а не просто генератором удивительных, но бесполезных картинок. А вы уже попробовали? Пишите в комментариях нашего Telegram-канала!