пʼятниця, 2 травня 2025 р.

Штучний інтелект замість співробітників? Усе пішло не за планом

Попри всі страхи, що штучний інтелект ось-ось замінить людей на роботі, новий експеримент вчених із Carnegie Mellon University показує: хвилюватися зарано. І не тому, що ШІ «не хоче» нас замінити, а тому, що він банально не здатен ефективно працювати в реальному середовищі.

Дослідники створили фальшиву IT-компанію під назвою TheAgentCompany, повністю укомплектовану агентами ШІ — автономними моделями від OpenAI, Google, Meta, Anthropic та інших. Ці боти зайняли позиції фінансових аналітиків, програмістів і менеджерів проєктів, а поруч із ними працювали змодельовані колеги — HR-відділ та технічний директор.

Завдання, які отримали агенти, імітували буденну роботу реальної софтверної компанії: навігація у файлових системах, віртуальні огляди офісів, написання відгуків про продуктивність співробітників на основі зібраного фідбеку.

Але, як з’ясувалося, уявна компанія швидко почала руйнуватись ізсередини. За даними Business Insider, результати були вкрай слабкими. Найуспішнішим агентом став Claude 3.5 Sonnet від Anthropic — і навіть він зміг завершити лише 24% поставлених завдань. При цьому кожне виконання вимагало близько 30 кроків і обходилось у понад $6.

Модель Google Gemini 2.0 Flash мала 11,4% успішності, але витрачала в середньому 40 кроків на кожне завдання. А найгіршим виявився агент Nova Pro v1 від Amazon, який упорався лише з 1,7% завдань.

Дослідники вказують на низку причин провалу: брак логіки, слабкі соціальні навички, труднощі з базовою навігацією в інтернеті, а також схильність до самообману. Один із найяскравіших прикладів — коли агент не зміг знайти потрібного колегу в чаті й просто перейменував іншого користувача на ім’я того, кого шукав.

Висновок простий і водночас промовистий: попри здатність виконувати дрібні завдання, агенти ШІ не справляються з більш складною, багаторівневою роботою, яку люди виконують щодня. І проблема тут не лише в технологіях — нинішній «інтелект» залишається, по суті, вдосконаленим автозаповненням, а не свідомим інструментом, здатним до адаптації, аналізу і навчання.

Тож хай там що обіцяють великі техногіганти, машини поки що не готові позбавити вас роботи. Людський мозок усе ще поза конкуренцією.

Авторка: Дар’я Бровченко

Джерело


Немає коментарів:

Дописати коментар

Примітка: лише член цього блогу може опублікувати коментар.