Корейська компанія LG виходить на ринок сервісів зі штучним інтелектом. На заході Computer Vision and Pattern Recognition 2023 представлено новий сервіс Captioning AI на базі генеративного ШІ. Якщо Midjourney та інші відомі ШІ генерують зображення за описом, то Captioning AI від LG створює опис за зображенням. Цей ШІ розпізнає елементи зображення та детально описує їх. Теоретично це проста ідея, але Captioning AI здатний на глибокий аналіз і висновки. Наприклад, ШІ здатний точно описати положення людини на пейзажі.

ШІ заснований на технології Zero-shot Image Captioning від групи розробників LG AI Research. Під час створення сервісу дослідники співпрацювали з платформою для зберігання візуального контенту Shutterstock.

ШІ може генерувати текстові описи та ключові слова для 10 000 зображень менш ніж за два дні, що може підвищити ефективність роботи та продуктивність компаній, які працюють з великими обсягами зображень.

Джерело:
The Korea Times