OpenAI випускає новий AI-агент, що отримав назву ChatGPT Agent — і ні, це не той самий агент, який уже є в них у портфоліо (вже троє AI-агентів — і так, у OpenAI з брендингом трохи хаос).
У своїй заяві компанія під керівництвом Сема Олтмана розповідає, що цей інструмент працює як віртуальний комп’ютер, який виконує завдання за тебе: перевіряє календар, щоб нагадати про зустрічі, купує продукти для сніданку або робить аналітичну презентацію про конкурентів.
Цей агент поєднує можливості двох попередніх: Operator — для завдань у браузері, і Deep Research — для багатокрокових дослідницьких завдань, наприклад, створення персоналізованих звітів. Тепер усе це доступне через знайомий інтерфейс чат-бота ChatGPT з можливістю «прокачати» роботу агента у діалоговому режимі.
Але є одна велика «але». За словами OpenAI, ChatGPT Agent завжди просить дозвіл перед важливими діями — тобто ти не можеш просто поставити його працювати і відійти. Людина має бути на зв’язку, щоб підтвердити ключові кроки.
З огляду на безпеку — це правильний підхід, адже AI часто помиляється. Уяви, що він збирається забронювати неправильний квиток або ж потрапляє під атаку, де хакери змушують його робити щось небезпечне чи викидати твої гроші.
Проте це яскраво показує, що технологія ще не викликає повної довіри — вона наче і крута, і дуже обмежена одночасно, бо надто «дурна», щоб діяти самостійно, і надто «потужна», щоб її повністю відпустити.
Схожа проблема була і з Agent Operator, який теж вимагав людського підтвердження для «фіналізації» важливих дій. Як і він, ChatGPT Agent переходить у режим «takeover», коли потрібно ввести чутливу інформацію — логіни, платіжні дані тощо.
Користувачі Operator скаржилися на його повільність: замість швидкої роботи він довго гірчав у браузері і просив допомоги там, де мав би впоратися сам.
Схоже, з ChatGPT Agent це не виправилось. Як зізнається Іза Фулфорд, керівниця проєкту, AI довго замовляв капкейки — цілу годину.
«Це зайняло майже годину, — розповіла вона Wired, — але це було легше, ніж робити це мені самій, бо я не хотіла цим займатися».
У демонстраційному ролику OpenAI теж не показали нічого надто переконливого.
Агент отримує завдання спланувати поїздку, щоб відвідати всі бейсбольні стадіони MLB у США — і генерує карту з зупинкою посеред Мексиканської затоки. Тут немає жодних бейсбольних арен, а час ігор теж вказано неправильно. Чистий провал.
«Крута карта, мабуть», — жартує керівник продукту Яш Кумар у відео. (Можна було просто вбити в Google «відвідати всі стадіони MLB» і знайти сотні сайтів із планами, навіть з інструментом Baseball-RoadTrip.com.)
Такі помилки OpenAI у відео не коментують, здається, що вони просто уникають перевірки роботи AI — і це не дивно.
Доступність
Першими новинку отримають користувачі Pro-підписки — з лімітом 400 запитів на місяць. Скоро доступ відкриють для Plus і Team з обмеженням у десяту частину цього обсягу. Для безкоштовних користувачів дати виходу не назвали.
Авторка: Дар’я Бровченко

Немає коментарів:
Дописати коментар
Примітка: лише член цього блогу може опублікувати коментар.