Компанія OpenAI запустила нову функцію 4o Image Generation для користувачів ChatGPT. Це точна фотореалістична генерація зображень за текстовим описом, яку вбудували в модель штучного інтелекту GPT-4o. Ця генерація повинна точно інтерпретувати й розуміти запити та підказки.

ChatGPT і раніше міг використовувати генерацію, наприклад за допомогою Dall‑E від тієї ж OpenAI. Але вбудована генерація забезпечить краще розуміння контексту, включно з можливістю перетворення завантажених зображень або використання їх як стилістичної основи.

Навчання на зображеннях, що відображають величезну різноманітність стилів, дає змогу ШІ створювати фотореалістичні зображення. Також ШІ може редагувати завантажені зображення, вирізати елементи або комбінувати частини різних зображень. Фактично це текстовий аналог Photoshop.

Також генерація GPT-4o коректно поєднує символи та зображення, уникаючи помилок. Коректна робота з текстом на зображенні та його послідовностями є однією з серйозних переваг відносно інших ШІ. Раніше це було проблемою під час генерації зображень.

Оскільки генерація зображень вбудована відразу в GPT-4o, ви можете покращувати зображення за допомогою природної розмови. GPT-4o спиратиметься на зображення і текст у контексті чату, забезпечуючи узгодженість протягом усього процесу. Наприклад, ви розробляєте персонажа відеоігри, і зовнішній вигляд персонажа залишається узгодженим протягом кількох ітерацій, поки ви експериментуєте з образом.

Генерація 4o вже доступна для користувачів ChatGPT Plus, Pro, Team і Free як генератор зображень за замовчуванням. Також користувачі ChatGPT зберігають доступ до Dall‑E. Розробники скоро зможуть підключати генерацію зображення за допомогою GPT-4o через API, доступ до яких відкриють протягом наступних кількох тижнів.