середа, 23 липня 2025 р.

Новий AI-агент від OpenAI: замовляє їжу цілу годину і радить відвідати бейсбольний стадіон посеред океану

OpenAI випускає новий AI-агент, що отримав назву ChatGPT Agent — і ні, це не той самий агент, який уже є в них у портфоліо (вже троє AI-агентів — і так, у OpenAI з брендингом трохи хаос).

У своїй заяві компанія під керівництвом Сема Олтмана розповідає, що цей інструмент працює як віртуальний комп’ютер, який виконує завдання за тебе: перевіряє календар, щоб нагадати про зустрічі, купує продукти для сніданку або робить аналітичну презентацію про конкурентів.

Цей агент поєднує можливості двох попередніх: Operator — для завдань у браузері, і Deep Research — для багатокрокових дослідницьких завдань, наприклад, створення персоналізованих звітів. Тепер усе це доступне через знайомий інтерфейс чат-бота ChatGPT з можливістю «прокачати» роботу агента у діалоговому режимі.

Але є одна велика «але». За словами OpenAI, ChatGPT Agent завжди просить дозвіл перед важливими діями — тобто ти не можеш просто поставити його працювати і відійти. Людина має бути на зв’язку, щоб підтвердити ключові кроки.

З огляду на безпеку — це правильний підхід, адже AI часто помиляється. Уяви, що він збирається забронювати неправильний квиток або ж потрапляє під атаку, де хакери змушують його робити щось небезпечне чи викидати твої гроші.

Проте це яскраво показує, що технологія ще не викликає повної довіри — вона наче і крута, і дуже обмежена одночасно, бо надто «дурна», щоб діяти самостійно, і надто «потужна», щоб її повністю відпустити.

Схожа проблема була і з Agent Operator, який теж вимагав людського підтвердження для «фіналізації» важливих дій. Як і він, ChatGPT Agent переходить у режим «takeover», коли потрібно ввести чутливу інформацію — логіни, платіжні дані тощо.

Користувачі Operator скаржилися на його повільність: замість швидкої роботи він довго гірчав у браузері і просив допомоги там, де мав би впоратися сам.

Схоже, з ChatGPT Agent це не виправилось. Як зізнається Іза Фулфорд, керівниця проєкту, AI довго замовляв капкейки — цілу годину.

«Це зайняло майже годину, — розповіла вона Wired, — але це було легше, ніж робити це мені самій, бо я не хотіла цим займатися».

У демонстраційному ролику OpenAI теж не показали нічого надто переконливого.

Агент отримує завдання спланувати поїздку, щоб відвідати всі бейсбольні стадіони MLB у США — і генерує карту з зупинкою посеред Мексиканської затоки. Тут немає жодних бейсбольних арен, а час ігор теж вказано неправильно. Чистий провал.

«Крута карта, мабуть», — жартує керівник продукту Яш Кумар у відео. (Можна було просто вбити в Google «відвідати всі стадіони MLB» і знайти сотні сайтів із планами, навіть з інструментом Baseball-RoadTrip.com.)

Такі помилки OpenAI у відео не коментують, здається, що вони просто уникають перевірки роботи AI — і це не дивно.

Доступність

Першими новинку отримають користувачі Pro-підписки — з лімітом 400 запитів на місяць. Скоро доступ відкриють для Plus і Team з обмеженням у десяту частину цього обсягу. Для безкоштовних користувачів дати виходу не назвали.

Авторка: Дар’я Бровченко


Джерело



Немає коментарів:

Дописати коментар

Примітка: лише член цього блогу може опублікувати коментар.