Ви можете звернутися до штучного інтелекту, щоб поставити запитання, створити контент і провести дослідження. Але, як кажуть, за все треба платити. У випадку зі штучним інтелектом плата – це дані користувачів. У новому звіті сервіс Surfshark проаналізував, які типи даних збирають різні чат-боти зі штучним інтелектом, і хто з них збирає найбільше.
У своєму звіті Surfshark розглянув 10 популярних чат-ботів зі штучним інтелектом – ChatGPT, Claude, DeepSeek, Google Gemini, Grok, Jasper, Meta AI, Microsoft Copilot, Perplexity, Pi і Poe. Під час аналізу було перевірено дані про конфіденційність для кожного додатка в App Store від Apple, а також політики конфіденційності DeepSeek і ChatGPT. Мета полягала в тому, щоб визначити, скільки типів даних збирає кожен додаток, чи збирає він дані, пов’язані з вами, і чи використовує додаток сторонню рекламу.
Surfshark зосередився на 35 різних типах даних, включаючи контактну інформацію, дані про здоров’я та фізичну форму, фінансову інформацію, місцезнаходження, конфіденційну інформацію, контакти, користувацький контент, історію, ідентифікатори, діагностику, дані про використання та покупки. Наприклад, конфіденційна інформація включає расові або етнічні дані, сексуальну орієнтацію, інформацію про вагітність або пологи, інвалідність, релігійні або філософські переконання, членство в профспілках, політичні погляди, генетичну інформацію або біометричні дані.
Усі 10 додатків зі штучним інтелектом збирають певні типи даних про користувачів. Середня кількість зібраних типів даних становила 13 з 35. Близько 45% додатків збирають дані про ваше місцезнаходження. Майже 30% відстежують дані користувачів, а це означає, що інформація, зібрана додатком, пов’язується з даними третіх сторін для показу таргетованої реклами або обміну з брокером даних.
Хто ж збирає дані користувачів найбільше?

Згідно з дослідженням Surfshark, на першому місці опинився Meta AI. Він збирає найбільше даних про користувачів – 32 з 35 можливих типів, або 90% з них. Meta AI виявився єдиним ШІ-додатком, який збирав дані з таких категорій, як фінансова інформація, здоров’я та фітнес, а також конфіденційна інформація. Крім того, тільки Meta і Copilot збирали дані, пов’язані з ідентифікацією користувача, для показу сторонньої реклами. Meta AI також може збирати до 24 різних типів даних для цієї мети.
Наступним у списку був Google Gemini, який збирає 22 різні типи даних. Додаток збирає дані про ваше точне місцезнаходження, а також контактну інформацію (ім’я, електронну адресу, номер телефону тощо), користувацький контент, контакти (список контактів на телефоні), історію пошуку та історію переглядів.
Замикають п’ятірку лідерів Poe, Claude і Copilot. Poe збирає 14 різних типів даних, Claude – 13, а Copilot – 12. Poe і Copilot – це два з трьох додатків (третім є Jasper), які збирають дані, що використовуються для відстеження вас. Використовуючи ідентифікатор вашого пристрою, Poe і Copilot можуть продавати ваші дані брокерам або використовувати їх для показу таргетованої реклами в додатку.
На шостому місці опинився DeepSeek, китайський штучний інтелект, який отримав похвалу за свою ефективність, але викликає занепокоєння щодо його походження. В аналізі Surfshark DeepSeek опинився посередині, збираючи 11 типів даних, включно з історією вашого чату.
Однак проблема з DeepSeek двояка. По-перше, оскільки він походить з Китаю, ваші результати можуть піддаватися цензурі за допомогою блокування забороненого контенту. По-друге, дані, зібрані штучним інтелектом, надсилаються до China Mobile, китайської державної телекомунікаційної компанії, якій заборонено працювати в США з 2019 року з міркувань національної безпеки.
Surfshark також зазначає, що DeepSeek стверджує, що зберігає інформацію стільки, скільки потрібно, зберігаючи її на серверах, розташованих у Китайській Народній Республіці.
«Не втрачайте пильності, оскільки чати, що зберігаються на серверах, завжди піддаються ризику бути зламаними», – застерігає Surfshark у своєму звіті. «За даними The Hacker News, DeepSeek вже пережив злом, коли стався витік понад 1 мільйона записів історії чатів, ключів API та іншої інформації. Загалом, це гарна ідея – бути уважними до наданої інформації».
Далі йде ChatGPT, який збирає 10 типів даних, таких як контактна інформація, вміст користувача, ідентифікатори, дані про використання та діагностика. Позитивним моментом є те, що штучний інтелект OpenAI не відстежує ваші дані і не використовує сторонню рекламу. Крім того, користувачі, які піклуються про конфіденційність, завжди можуть звернутися до тимчасових чатів, в яких всі дані автоматично видаляються через 30 днів. Крім того, ви можете вимагати, щоб ваші персональні дані не використовувалися в навчальних цілях.
Завершують топ-10 список Grok, Pi та Jasper. Surfshark виявив, що Grok збирає сім типів даних, а Pi і Jasper – по п’ять різних типів. Хоча Jasper посів останнє місце, він збирає ідентифікатори пристроїв, дані про взаємодію з продуктами, рекламні дані та інші дані про використання, щоб надсилати вам таргетовану рекламу або ділитися даними з брокером.
Збір даних про користувачів є поширеною практикою не лише серед штучних інтелектів, але й серед інших мобільних додатків, соціальних мереж, пошукових систем та програмного забезпечення. Часто це ціна, яку доводиться платити, щоб отримати безкоштовні або недорогі продукти, які покладаються на рекламу. Але це не означає, що ви повинні добровільно підкорятися.
ChatGPT та інші програми та сервіси зі штучним інтелектом надають вам можливість запобігти або принаймні обмежити збір ваших даних. Найкраще вивчити політику конфіденційності та налаштування будь-якого штучного інтелекту, який ви використовуєте, щоб дізнатися, як ви можете контролювати свої дані.