Компания OpenAI, которая занимается разработкой и развитием ChatGPT, представила новую функцию для своего искусственного интеллекта. Это ИИ-агент Operator, который может выполнять вместо пользователя разные действия в Интернете. Человеку достаточно сформировать задачу или описание действий, а Operator все это выполнит сам. К примеру, агент может искать и оформлять бронирование гостиницы, делать покупки или даже делать посты вместо вас в социальных сетях. То есть нам предлагается очередной упрощенный способ взаимодействия с Сетью, где от пользователя потребуется лишь описание задачи для ИИ-агента, а все остальные операции на ПК он сделает сам.
Оператор использует модель, которая объединяет возможности зрения GPT-4o с продвинутым рассуждением посредством обучения с подкреплением, чтобы иметь возможность взаимодействовать с графическими интерфейсами. Operator может «видеть» и взаимодействовать (используя все действия, которые позволяют мышь и клавиатура) с браузером, что позволяет выполнять действия в Интернете без необходимости в интеграции пользовательских API. Упоминается, что Operator разрабатывался так, чтобы блокировать вредоносные запросы и работу с запрещенным контентом. Также он просит пользователя взять на себя управление, когда сайт запрашивает конфиденциальную информацию.
Предварительная версия такого агента уже доступна для пользователей платного тарифа ChatGPT Pro в США. OpenAI сотрудничает с компаниями DoorDash, Instacart, OpenTable, Priceline, StubHub, Thumbtack, Uber и другими, чтобы обеспечить функциональность Operator с учетом всех потребностей и установленных правил. Но разработчик предупреждает, что пока у агента возможны проблемы с некоторыми сложными интерфейсами. В будущем OpenAI хочет интегрировать возможности Operator в ChatGPT для пользователей тарифов Plus, Team и Enterprise.
Источник:
The Verge