середа, 23 липня 2025 р.

Перший погляд на новий агент ChatGPT (і як він може змінити інтернет)

OpenAI випустила агента ChatGPT — інструмент ШІ, що діє від імені користувача. Це не просто чат-бот, а система, здатна виконувати складні багатокрокові завдання з допомогою власного віртуального комп’ютера. Можна доручити йому, скажімо, аналіз конкурентів і створення презентації або планування обіду з подальшою покупкою інгредієнтів. Агент переглядає сайти, виконує код, аналізує дані і готує редаговані документи.

ChatGPT агент поєднує функції кількох інструментів в єдину систему. Він не лише аналізує проблему, а й послідовно виконує кроки для її вирішення — змінюючи підхід до цифрових завдань як у побуті, так і в роботі. Проривні можливості такого агента мають масштабні наслідки для майбутнього ШІ-помічників, але ставлять нові виклики щодо безпеки.

Заглядаючи під капот

Сила агента — в об’єднанні двох раніше окремих функцій: навичок взаємодії з сайтами (як у Operator) і аналітики (як у deep research), що дозволяє синтезувати дані з інтернету в єдиному процесі.

Агент використовує набір інструментів: візуальний і текстовий браузери, термінал для коду і API-з’єднання з Gmail, Github та іншими. Це дає змогу обирати найефективніший спосіб — від API-перевірки календаря до роботи з графічними вебдодатками. Уся робота відбувається у віртуальному комп’ютері, що зберігає контекст між інструментами. Схожий підхід розвиває китайський стартап Manus.

OpenAI наголошує: користувач залишається контролером. У реальному часі видно дії агента, його можна зупинити або взяти керування. Для реальних дій, як покупка, обов’язкове підтвердження людиною.

Як ChatGPT агент змінює правила гри

Ключова новинка — інтерактивний робочий процес. Раніше треба було чекати завершення завдання, тепер можна втрутитися в будь-який момент. Агент сам просить уточнень, якщо щось незрозуміло, і дозволяє користувачу коригувати хід роботи на ходу — майже як у співпраці з людиною.

Результати вражають: рекорд 68,9% у тесті BrowseComp (пошук складної інформації), 45,5% на SpreadsheetBench проти 20% у Copilot в Excel, 27,4% точності на FrontierMath — найважчому математичному тесті.

Обіцянки, ризики та майбутнє

Попри контроль і втручання, кінцева мета — більша автономність. Поточний режим “підглядання через плече” — тимчасовий. У майбутньому агент сам визначатиме, коли йому потрібна допомога. Це має зменшити навантаження на користувача.

Втім, більше автономії — більше ризиків. Агент створює завершені продукти — презентації чи моделі — які виглядають переконливо, але можуть містити неточності. Їх важко перевірити, особливо коли дані взяті з десятків джерел. Наприклад, агент створив презентацію з результатами тестів — вона виглядала бездоганно, але користь була лише тому, що дослідники знали, що саме перевіряти.

Безпека — ще одне велике питання. OpenAI запровадила захисти від ін’єкцій запитів і вимагає підтвердження для критичних дій. Але нові можливості — нові вектори атак. Зловмисники можуть обдурити агента через приховані інструкції або створити сторінки, що показують агенту інший контент, ніж людині. Це відкриває складні виклики безпеці, які ще не покриваються поточними технологіями.

Погляд у майбутнє вебу

Агенти на кшталт ChatGPT — лише початок трансформації інтернету. Сьогодні вони вчаться орієнтуватися в середовищі, створеному для людей. Наступний крок — адаптація інтернету і для ШІ. Це передбачає стандартизовані API та MCP-інтерфейси, що дозволяють агентам напряму взаємодіяти із сайтами — без потреби “читати” візуальні інтерфейси. Такий зсув відкриє нові горизонти для застосування агентів.

Авторка: Дар’я Бровченко


Джерело



Немає коментарів:

Дописати коментар

Примітка: лише член цього блогу може опублікувати коментар.