понеділок, 26 травня 2025 р.

Які чат-боти ШІ найбільше збирають ваші дані: Meta — лідер збору персональної інформації

У час стрімкого розвитку штучного інтелекту багато людей щодня звертаються до AI-чат-ботів за відповідями, генерацією текстів чи пошуком інформації. Але як нагадує звіт компанії Surfshark, за зручністю стоїть плата — і найчастіше це ваші персональні дані.

VPN-сервіс і компанія з кібербезпеки Surfshark проаналізувала, які саме дані збирають найпопулярніші чат-боти, наскільки ці дані прив’язані до особистості користувача, а також чи використовуються вони для реклами. У дослідженні розглянуто десять провідних AI-сервісів, серед яких ChatGPT, Claude AI, DeepSeek, Google Gemini, Grok, Jasper, Meta AI, Microsoft Copilot, Perplexity, Pi і Poe. Аналітики звертали увагу на дані, що зазначені в App Store, а також вивчали політики конфіденційності застосунків, зокрема ChatGPT і DeepSeek.

Усього фахівці Surfshark виділили 35 типів користувацьких даних — від контактної інформації та історії активності до фінансових, медичних, біометричних даних і навіть відомостей про расу, релігію чи політичні погляди. У середньому кожен застосунок збирає 13 із 35 можливих типів даних. Майже половина сервісів відстежує геолокацію користувача, а близько 30% — пов’язують отриману інформацію з іншими джерелами, щоб формувати рекламні профілі або передавати дані брокерам.

Найбільшим “збирачем” виявився Meta AI — він отримує доступ до 32 типів користувацьких даних із 35 можливих, що становить понад 90%. Це єдиний сервіс, який охоплює одразу фінансову інформацію, дані про здоров’я, а також чутливі персональні відомості. До того ж, лише Meta та Microsoft Copilot пов’язують дані з ідентичністю користувача для показу сторонньої реклами. Meta може використовувати до 24 типів інформації виключно для рекламних цілей.

На другому місці за обсягом зібраної інформації опинився Google Gemini. Він збирає 22 різновиди даних, зокрема точну геолокацію, контактну інформацію, список контактів із телефону, а також історію пошукових запитів і переглядів у браузері. Далі в рейтингу опинились Poe, Claude і Copilot. Вони отримують доступ відповідно до 14, 13 і 12 типів даних. Особливістю Poe, Copilot і Jasper є те, що ці застосунки використовують ідентифікатори пристрою для стеження за користувачем. Це дозволяє або продавати зібрану інформацію брокерам, або демонструвати персоналізовану рекламу безпосередньо в додатку.

Окремої уваги заслуговує китайський застосунок DeepSeek, який посів шосту позицію. Він збирає 11 типів даних, включно з історією чатів. Проте занепокоєння викликає не лише обсяг інформації, а й те, що дані зберігаються на серверах у КНР і можуть передаватися державному оператору China Mobile, який з 2019 року заборонений у США через загрози національній безпеці. Surfshark також зазначає, що DeepSeek залишає за собою право зберігати дані стільки, скільки вважає за необхідне. Це викликає додаткові ризики, особливо з урахуванням попереднього витоку понад мільйона записів чату, API-ключів та іншої приватної інформації, про який повідомляло видання The Hacker News.

На сьомій позиції у списку опинився ChatGPT. Він збирає 10 типів даних, серед яких контактна інформація, контент користувача, ідентифікатори, дані про використання та діагностику. Проте OpenAI не використовує ці дані для таргетованої реклами і не продає їх третім сторонам. Крім того, користувачі можуть активувати тимчасові чати, дані з яких автоматично видаляються через 30 днів. Існує також можливість подати запит на вилучення персональних даних з навчальних масивів.

Трійку найменш «жадібних» AI-асистентів замкнули Grok, Pi та Jasper. Grok збирає 7 типів даних, Pi і Jasper — по 5. Хоча Jasper і посів останнє місце в рейтингу, він усе одно використовує ідентифікатори пристрою, інформацію про взаємодію з продуктом і рекламну активність, що дозволяє надсилати таргетовану рекламу або передавати ці дані брокерам.

Збір даних користувачів — практика поширена не лише серед AI-застосунків, а й у сфері мобільних додатків, соцмереж, пошукових систем і програмного забезпечення загалом. Часто саме за рахунок персональної інформації користувача й існують безкоштовні або недорогі продукти. Проте це не означає, що варто просто погоджуватись.

Звіт Surfshark наголошує: навіть якщо використання AI стало звичкою, не варто забувати про цифрову гігієну. Більшість застосунків мають налаштування, які дозволяють обмежити збір даних або хоча б контролювати його. Щоб захистити свою конфіденційність, користувачам варто ознайомитись із політиками приватності та вивчити можливості, які кожен застосунок надає для керування персональними даними.

Авторка: Дар’я Бровченко


Джерело

Немає коментарів:

Дописати коментар

Примітка: лише член цього блогу може опублікувати коментар.