вівторок, 10 червня 2025 р.

Дослідники Apple: сучасні ШІ-моделі ще далеко не на рівні AGI

Попри стрімкий розвиток великих мовних моделей, штучний інтелект усе ще не здатен міркувати на рівні, який відповідає очікуванням від AGI — штучного загального інтелекту, повідомляють дослідники Apple.

У червні команда Apple Machine Learning Research опублікувала наукову роботу під назвою “Ілюзія мислення”, в якій розглядається обмеженість reasoning-здібностей навіть у найновіших великих мовних моделях (LLMs), зокрема таких, як ChatGPT від OpenAI і Claude від Anthropic.

Попри те, що нові версії моделей включають компоненти підвищеного «мислення» — великі reasoning-моделі (LRMs), їхні реальні можливості, масштабованість і межі все ще залишаються недостатньо вивченими, зазначили автори дослідження.

“Більшість оцінок сьогодні зосереджені на точності кінцевої відповіді за математичними та програмістськими тестами, але це не дає уявлення про саму здатність до міркування”, — пояснюють дослідники Apple.

Підхід Apple: не задачки — а справжні головоломки

Щоб протестувати справжню здатність моделей до міркування, команда Apple розробила низку логічних головоломок. Вони випробували як «мислячі», так і «немислячі» варіанти моделей Claude Sonnet, OpenAI o3-mini і o1, а також DeepSeek-R1 і V3.

Результати були неоднозначними: ускладнення задач повністю руйнує точність відповідей — моделі перестають узагальнювати знання та втрачають «розумову перевагу». А це суперечить базовим очікуванням від AGI.

“Ми побачили, що великі reasoning-моделі мають серйозні обмеження у точних обчисленнях: вони не використовують чіткі алгоритми і поводяться непослідовно в різних типах задач”, — підкреслюють автори.

На додачу, виявилось, що на низькому рівні складності «немислячі» моделі дають точніші відповіді. Дослідники також відзначили так зване “overthinking” — моделі часто видають правильну відповідь одразу, але потім починають надмірно міркувати, плутаючись і помиляючись.

AGI: ще не зараз

Загальний висновок: сучасні моделі лише імітують логіку, але не здатні її дійсно осмислювати чи застосовувати . Це суттєво віддаляє їх від рівня AGI.

“Наші результати ставлять під сумнів поширені уявлення про можливості LRM-моделей і вказують на те, що ми стикаємось із фундаментальними бар’єрами в досягненні справжнього узагальненого міркування”, — підсумували в Apple.

AGI — це умовна «фінішна пряма» в розвитку штучного інтелекту: машина, яка мислить як людина й здатна на загальне розуміння світу. Хоча топменеджери технологічних компаній — зокрема, Сем Альтман з OpenAI та Даріо Амодей з Anthropic — заявляють про близькість до AGI вже до 2026 року, дослідження Apple свідчить: цей рубіж ще далеко.

Авторка: Дар’я Бровченко


Джерело



Немає коментарів:

Дописати коментар

Примітка: лише член цього блогу може опублікувати коментар.