неділя, 29 червня 2025 р.

Нове дослідження: ШІ «розуміє» емоції краще за людей — особливо в напружених ситуаціях

Популярні моделі штучного інтелекту (ШІ) перевершили людей у тестах на емоційну інтелігентність, проте експерти радять не поспішати з висновками. У науковому світі знову розгортається дискусія: штучний інтелект, здавалося б, краще «розуміє» емоції, ніж люди. Нове дослідження показало, що ШІ вибирає правильні реакції в емоційно напружених ситуаціях набагато частіше, ніж середньостатистична людина.

Вчені з Женевського університету (UNIGE) та Бернського університету (UniBE) 21 травня опублікували дослідження в журналі Communications Psychology. Вони протестували популярні великі мовні моделі (LLM) — ChatGPT-4, ChatGPT-o1, Gemini 1.5 Flash, Claude 3.5 Haiku, Copilot 365 та DeepSeek V3 — за допомогою поширених тестів на емоційну інтелігентність (STEM, STEU, GEMOK-Blends, GECo Regulation, GECo Management).

Результати: ШІ вибрав «правильну» відповідь у 81% випадків (за оцінками експертів), тоді як люди — лише в 56%.

Крім того, коли ChatGPT попросили створити нові тестові питання, люди-експерти визнали, що штучний інтелект впорався з цим завданням — питання були не простими перефразуваннями, а зберігали складність оригінальних тестів. Кореляція між новими і оригінальними тестами виявилася «великою» (коефіцієнт 0,46 із 1).

Загальний висновок дослідників: ШІ «краще розуміє» емоції, ніж люди.

Але є нюанси

Коли журналісти Live Science поспілкувалися з експертами, ті застерегли не робити поспішних висновків. Всі тести на емоційну інтелігентність, що застосовувалися, — це варіанти вибору, які мало відображають реальні емоційні конфлікти між людьми.

«Варто пам’ятати, що навіть люди часто не погоджуються, що саме відчуває інша людина. Психологи теж іноді по-різному тлумачать емоції», — пояснює фахівець з інформаційної безпеки та фінансів Таймур Іджлал. «Тож те, що ШІ «перевершив» людину в такому тесті, не означає, що він глибше розуміє емоції. Просто він частіше давав статистично очікувану відповідь.»

Експерти наголошують, що в дослідженні перевіряли не емоційну інтелігентність у повному розумінні, а здатність розпізнавати шаблони — а це одна з сильних сторін ШІ. На думку Наумана Джаффара, засновника CliniScripts, ШІ чудово розпізнає шаблони у мовленні чи міміці, але це не те саме, що справжнє «розуміння» людських емоцій.

Більшість погоджуються: штучний інтелект ефективний у структурованих, контрольованих тестах — але не здатен відчути емоції «в моменті», як це робить людина.

«Відомий тест Reading the Mind in the Eyes демонструє, що ШІ добре справляється з розпізнаванням емоцій на фотографіях. Але зміна освітлення або культурного контексту різко знижує його точність», — пояснює Джейсон Генессі, експерт із аналізу мови в AI.

В цілому більшість експертів вважають заяву про те, що ШІ «краще розуміє» емоції, дещо перебільшеною.

«Чи допомагають великі мовні моделі класифікувати емоційні реакції? Так. Але це як називати когось гарним терапевтом, бо він добре пройшов тест на емоції в BuzzFeed», — додає Вайат Мейхем, засновник Northwest IT Consulting.

Реальні кейси показують інше

Проте навіть з урахуванням обмежень, ШІ вже перевершує людей у реальних емоційних ситуаціях.

Приклад — Aílton, конверсаційний ШІ, що працює у WhatsApp із 6 000 бразильських далекобійників. Цей помічник визначає стрес, злість і сум із точністю близько 80% — на 20 пунктів вище, ніж люди в аналогічних обставинах.

У одному випадку Aílton швидко та влучно відреагував на 15-секундне голосове повідомлення водія, який був засмучений через загибель колеги: висловив співчуття, запропонував підтримку з психічного здоров’я і повідомив керівництво автопарку.

«Звісно, тести — це спрощення реального розпізнавання емоцій, яке відбувається постійно та в різних форматах», — пояснює розробник Aílton, Маркос Алвес. «Але вивчення когнітивної складової — важливий крок. Це показує, чи може ШІ розпізнавати емоційні сигнали без «шуму» ситуації.»

Алвес додає, що здатність ШІ обробляти мільярди речень і тисячі годин розмов дозволяє помічати інтонації, які люди часто не помічають. «Лабораторні умови обмежені, але наші дані з WhatsApp підтверджують, що сучасні великі мовні моделі вже розпізнають і реагують на емоції краще, ніж більшість людей — забезпечуючи емпатію в масштабі.»

Підсумок: Так, ШІ демонструє вражаючі результати у структурованих тестах на емоційну інтелігентність і навіть у деяких реальних ситуаціях. Але поки що це більше нагадує швидке впізнавання шаблонів, а не справжнє розуміння людських почуттів.

Авторка: Дар’я Бровченко


Джерело


Немає коментарів:

Дописати коментар

Примітка: лише член цього блогу може опублікувати коментар.