Компания OpenAI запустила новую функцию 4o Image Generation для пользователей ChatGPT. Это точная фотореалистичная генерация изображений по текстовому описанию, которую встроили в модель искусственного интеллекта GPT‑4o. Эта генерация должна точно интерпретировать и понимать запросы и подсказки.

ChatGPT и ранее мог использовать генерацию, например с помощью Dall‑E от той же OpenAI. Но встроенная генерация обеспечит лучшее понимание контекста, включая возможность преобразования загруженных изображений или использование их в качестве стилистической основы.

Обучение на изображениях, отражающих огромное разнообразие стилей, позволяет ИИ создавать фотореалистичные изображения. Также ИИ может редактировать загруженные изображения, вырезать элементы или комбинировать части разных изображений. По факту это текстовый аналог Photoshop.

Также генерация GPT‑4o корректно сочетает символы и изображения, избегая ошибок. Корректная работа с текстом на изображении и его последовательностями является одним из серьезных преимуществ относительно других ИИ. Ранее это было проблемой при генерации изображений.

Поскольку генерация изображений встроена сразу в GPT‑4o, вы можете улучшать изображения посредством естественного разговора. GPT‑4o будет опираться на изображения и текст в контексте чата, обеспечивая согласованность на протяжении всего процесса. Например, вы разрабатываете персонажа видеоигры, и внешний вид персонажа остается согласованным на протяжении нескольких итераций, пока вы экспериментируете с образом.

Генерация 4o уже доступна для пользователей ChatGPT Plus, Pro, Team и Free в качестве генератора изображений по умолчанию. Также пользователи ChatGPT сохраняют доступ к Dall‑E. Разработчики скоро смогут подключать генерацию изображения с помощью GPT‑4o через API, доступ к которым отроют в течение следующих нескольких недель.