OpenAI запускає новий AI-агент під назвою Operator, який може виконувати завдання автономно, тобто без участі користувача. Генеральний директор OpenAI, Сем Альтман, почав рік з того, що заявив у блозі, що цей рік стане вирішальним для AI-агентів. Це інструменти, які можуть автоматизувати завдання та виконувати дії від імені користувачів.
Це перша серйозна спроба OpenAI запустити такого агента. У четвер компанія оголосила про запуск дослідницької версії Operator — універсального AI-агента, який може керувати веббраузером та самостійно виконувати певні завдання. Спочатку Operator стане доступним для користувачів у США, які підписані на тариф Pro за $200 у ChatGPT. Потім OpenAI планує поступово розширити доступ до користувачів тарифів Plus, Team та Enterprise.
«Operator з'явиться в інших країнах найближчим часом», — заявив Сем Альтман під час прямої трансляції в четвер. «В Європі, на жаль, це займе трохи більше часу». Дослідницька версія доступна на operator.chatgpt.com.
Що вміє Operator? Operator дозволяє автоматизувати різні завдання, такі як бронювання подорожей, замовлення столиків у ресторанах та онлайн-шопінг. В інтерфейсі Operator є кілька категорій завдань, зокрема покупки, доставка, харчування та подорожі. Кожна з цих категорій відкриває можливості для різних видів автоматизації.
Коли користувачі активують Operator, з'являється невелике вікно з браузером, де агент виконує завдання. Користувачі можуть брати на себе управління, оскільки Operator використовує окремий браузер.
OpenAI заявляє, що Operator працює на основі моделі Computer-Using Agent (CUA), яка поєднує візуальні можливості GPT-4o та логічні здібності інших просунутих моделей OpenAI. CUA навчена працювати з фронтендом сайтів, тому їй не потрібні API для доступу до сервісів. Вона використовує кнопки, меню та форми, як це роблять люди.
Щоб забезпечити дотримання умов використання сервісів, OpenAI співпрацює з компаніями, такими як DoorDash, eBay, Instacart, Priceline, StubHub та Uber. Агент запитує підтвердження від користувача перед завершенням завдань із зовнішніми наслідками, наприклад перед оформленням замовлення чи надсиланням електронної пошти. Це дає змогу користувачам перевірити роботу агента перед остаточним виконанням завдання.
Однак наразі є деякі обмеження. Наприклад, Operator не може виконувати складні чи спеціалізовані завдання, такі як створення слайдшоу або робота з нестандартними вебінтерфейсами. Для деяких завдань, як введення даних банківської карти, потрібна участь користувача. Також агент може «застрягти» через CAPTCHA або складний інтерфейс.
AI-агенти, такі як Operator, мають потенціал змінити спосіб взаємодії людей з інтернетом і комп’ютерами. Вони можуть не лише обробляти інформацію, але й виконувати конкретні дії. OpenAI продемонструвала, що Operator здатен виконувати багато завдань, і хоч компанія залишає простір для вдосконалення, це лише перший крок до майбутніх досягнень у автоматизації повсякденних справ.
Авторка: Дар’я Бровченко
Немає коментарів:
Дописати коментар
Примітка: лише член цього блогу може опублікувати коментар.