вівторок, 1 липня 2025 р.

Агенти ШІ в офісі: більше хайпу, ніж результатів

Аналітики Gartner прогнозують, що понад 40% проєктів з агентним ШІ (agentic AI) будуть скасовані до кінця 2027 року через зростання витрат, неясну бізнес-цінність або недостатній контроль ризиків.

Якщо вірити цим прогнозам, то близько 60% проєктів залишаться активними, що вже виглядає вражаюче — особливо якщо врахувати, що дослідники Carnegie Mellon University (CMU) та Salesforce зафіксували лише 30–35% успішного виконання багатокрокових завдань агентним ШІ.

Ще більше плутає те, що Gartner стверджує: більшість так званих агентних AI-продуктів насправді такими не є.

Що таке агентний ШІ?

Це модель машинного навчання, поєднана з різними сервісами й додатками для автоматизації бізнес-процесів. Уявіть собі ШІ, що в циклі аналізує запит і через програми чи API намагається виконати завдання.

Наприклад, агентний ШІ може отримати всі листи, в яких містяться перебільшені твердження про ШІ, і перевірити, чи пов’язані відправники з компаніями, що працюють у сфері криптовалют. Ідея в тому, що ШІ самостійно має зрозуміти, що означає «перебільшені твердження», тоді як людині-програмісту було б складніше заздалегідь прописати всі правила для такого аналізу.

Фантастика vs Реальність

Ідея, що програма приймає команди і виконує їх ідеально, без помилок і зайвих проблем, — це класика наукової фантастики. У реальному світі компанії типу Anthropic пропонують більш приземлені варіанти: ШІ-агенти для клієнтської підтримки, які можуть відповідати на дзвінки, повертати гроші або направляти складні питання живому оператору.

Але з цим приходять і питання — копірайт, праця, упередження, екологія, а також безпека та приватність. Як зазначила Мередіт Віттакер із Signal Foundation, агенти потребують доступу до чутливих даних, що створює великі ризики для безпеки.

Тестування агентів у офісі

Дослідники CMU створили бенчмарк TheAgentCompany — імітацію роботи маленької софтверної компанії, щоб протестувати, як AI агенти справляються зі звичайними офісними завданнями: серфінгом в інтернеті, програмуванням, спілкуванням з колегами.

Результати не вражають: найкращий агент, Gemini-2.5-Pro, виконав лише 30,3% завдань повністю. Решта — від 26% і нижче, деякі навіть не дотягують до 5%.

Під час тестів агенти допускали банальні помилки: забували написати колезі, не справлялися з спливаючими вікнами, а дехто навіть обманював — наприклад, перейменовував іншого користувача, щоб «швидко вирішити» проблему.

Ще про інші дослідження

Salesforce презентували свій бенчмарк CRMArena-Pro для оцінки агентів у CRM-задачах. Там лідери демонструють 58% успіху у простих завданнях, але ефективність падає до 35% у складних багатоетапних діалогах. Також виявлено, що ШІ-агенти майже не усвідомлюють конфіденційність, що є серйозним мінусом для корпоративного використання.

Висновки Gartner і експертів

«Більшість агентних AI-пропозицій не дають помітної цінності чи ROI, оскільки нинішні моделі не достатньо розвинені для складних бізнес-цілей чи виконання детальних інструкцій»,
— заявила Анушрі Верма з Gartner.

Водночас Gartner очікує, що до 2028 року близько 15% щоденних робочих рішень прийматимуть AI-агенти, а 33% корпоративних програм включатимуть агентний ШІ.

Підсумок:

AI-агенти часто не справляються з завданнями, роблять помилки і не відповідають за безпеку. Але технологія розвивається, і навіть часткова автоматизація має потенціал для допомоги людям, особливо у сфері кодування.

Авторка: Дар’я Бровченко


Джерело



Немає коментарів:

Дописати коментар

Примітка: лише член цього блогу може опублікувати коментар.