Про це йдеться в повідомленні OpenAI.
Як зазначають у компанії, «Оператор» може переглядати вебсторінки, вводити текст, натискати кнопки та прокручувати сторінки. Його можна залучити до виконання різних завдань, включно із заповненням форм, оформленням замовлень або навіть створенням мемів.
Наразі доступ до «Оператора» обмежений: він працює лише в США і лише для підписників тарифного плану ChatGPT Pro, що коштує 200 доларів на місяць.
“Цей попередній перегляд дозволяє нам вчитися у наших користувачів і ширшої екосистеми, вдосконалюючи продукт під час роботи. У майбутньому ми плануємо розширити доступ до користувачів планів Plus, Team і Enterprise, а також інтегрувати ці функції в ChatGPT”, – наголосили в OpenAI.
Новий інструмент працює на основі моделі Computer-Using Agent (CUA), яка навчає ШІ взаємодіяти з графічними елементами інтерфейсу — кнопками, меню та текстовими полями.
«Оператор» може «бачити» інтерфейс за допомогою скриншотів і «взаємодіяти» з браузером, виконуючи дії без потреби в інтеграції API. Якщо ШІ припускається помилок, він здатен їх самостійно виправити. У випадках, коли агент не може впоратися із завданням, він повертає контроль користувачеві.
Нагадаємо, Google тестує функцію Daily Listen на основі ШІ: персоналізовані подкасти з новинами для користувачів.