Во время конференции Google I/O компания представила нового голосового ассистента с искусственным интеллектом Gemini Live. По сути, это голосовой чат-бот с расширенными возможностями. Система использует продвинутые алгоритмы генеративного ИИ для общения с пользователем. Помощник будет более индивидуальным и сможет адаптироваться к речи конкретного пользователя. Gemini Live будет доступен подписчикам Gemini Advanced в ближайшие месяцы.

Ассистент Gemini Live использует мощные возможности платформы Gemini 1.5 с дополнительными ИИ-технологиями. В частности, позднее в него интегрируют возможность работы с камерой. Gemini Live сможет реагировать на окружение, воспринимая объекты через фотографии и видео прямо в режиме реального времени. Аналогичные возможности демонстрирует новая версия GPT-4o от Open AI. Также у Gemini Live будет интеграция с приложениями Google Календарь, Задачи и Google Keep.

Gemini Live связан с другой разработкой компании под названием Project Astra. Это многофункциональный мультимодальный помощник, который может смотреть и интерпретировать все, что видит через камеру вашего устройства. Он сможет ориентироваться в пространстве и запоминать положение предметов.

Опубликована демонстрация, в которой Project Astra описывает разные предметы и элементы окружающего мира, а также помогает пользователю найти очки, указывая их местоположение.

Источник:
The Verge
Google