Новый ИИ-агент Operator, разработанный OpenAI, предлагает пользователям возможность делегировать рутинные онлайн-задачи. Этот инструмент, находящийся пока в стадии исследовательского превью для подписчиков ChatGPT Pro в США, способен самостоятельно заполнять веб-формы, заказывать товары и даже создавать мемы. Он представляет собой комбинацию передовых возможностей обработки изображений GPT-4o и продвинутого обучения с подкреплением, что позволяет ему взаимодействовать с веб-страницами на более глубоком уровне.
Принцип работы Operator основан на модели Computer-Using Agent (CUA), которая позволяет ему имитировать действия пользователя в браузере. Однако пользователь всегда может взять контроль на себя, внося изменения и коррективы в действия ИИ. Агент также запрашивает разрешение для выполнения действий, связанных с чувствительной информацией, и не сохраняет её, обеспечивая дополнительную конфиденциальность.
Несмотря на то, что Agent способен выполнять широкий спектр действий в интернете, он не заменит полностью потребность в человеческом участии. Для задач, требующих аутентификации или ввода платежных данных, пользователь должен предоставить информацию самостоятельно. Более того, перед финальным выполнением определенных действий, таких как размещение заказа или отправка письма, Operator запрашивает подтверждение пользователя, что снижает риск несанкционированных действий.
Появление Operator вызывает обсуждения о будущей роли ИИ в повседневной жизни. Пользователи с воодушевлением восприняли возможность делегировать рутинные задачи, такие как заполнение форм и заказы, что потенциально может освободить время для более творческих и значимых занятий. При этом, сохраняется вопрос, не приведет ли это к излишней пассивности и зависимости от технологий. Тем не менее, появление подобных инструментов указывает на прогресс в создании более интеллектуальных и самостоятельных программных агентов.
Изображение носит иллюстративный характер
Принцип работы Operator основан на модели Computer-Using Agent (CUA), которая позволяет ему имитировать действия пользователя в браузере. Однако пользователь всегда может взять контроль на себя, внося изменения и коррективы в действия ИИ. Агент также запрашивает разрешение для выполнения действий, связанных с чувствительной информацией, и не сохраняет её, обеспечивая дополнительную конфиденциальность.
Несмотря на то, что Agent способен выполнять широкий спектр действий в интернете, он не заменит полностью потребность в человеческом участии. Для задач, требующих аутентификации или ввода платежных данных, пользователь должен предоставить информацию самостоятельно. Более того, перед финальным выполнением определенных действий, таких как размещение заказа или отправка письма, Operator запрашивает подтверждение пользователя, что снижает риск несанкционированных действий.
Появление Operator вызывает обсуждения о будущей роли ИИ в повседневной жизни. Пользователи с воодушевлением восприняли возможность делегировать рутинные задачи, такие как заполнение форм и заказы, что потенциально может освободить время для более творческих и значимых занятий. При этом, сохраняется вопрос, не приведет ли это к излишней пассивности и зависимости от технологий. Тем не менее, появление подобных инструментов указывает на прогресс в создании более интеллектуальных и самостоятельных программных агентов.