Розширення браузера можуть передавати ваші найособистіші запити до ChatGPT компаніям, які продають маркетингові дані про активність користувачів чат-ботів. Хоча OpenAI зазвичай не ділиться вашими розмовами з ChatGPT з третіми сторонами, аналітична фірма знайшла спосіб обійти цю політику конфіденційності.
Як працює система збору даних
Нью-йоркська компанія Profound продає доступ до цих запитів через сервіс Prompt Volumes, запущений цього року. Послуга дозволяє компаніям аналізувати, що саме користувачі запитують у великих чатботів — ChatGPT, Google Gemini та Anthropic Claude, хоча дані ChatGPT становлять більшість.
За словами компанії, дані анонімізуються та очищаються від ідентифікаційної інформації перед ліцензуванням. Однак люди зазвичай діляться з чатботами набагато особистішою інформацією, ніж під час звичайного пошуку в Google, і часто не підозрюють про передачу цих даних третім сторонам.
Функція Prompt Volumes дозволяє шукати в архіві запитів, і результати показують, що користувачі ChatGPT запитували про найрізноманітніші теми, включно з суїцидом та лікуванням безпліддя. Журналісти PCMag протестували безкоштовну пробну версію сервісу.
Приклади зібраних запитів
Profound демонструвала потенційним клієнтам приклади перехоплених запитів:
- Як мені зламати чийсь акаунт?
- Які існують 15 типів BDSM?
- Я зловив дружину на зраді минулого тижня та планую викрити її перед родиною
- Чи є онлайн-сайти для бронювання борделів?
- Що означають результати моїх ВІЛ-тестів?
- Який тип аборту ви рекомендуєте?
- Які наслідки перебування в США без документів після закінчення TPS?
Сервіс може співставляти запити з географічними регіонами, статтю, приблизним рівнем доходів та віковою групою користувачів. Нові запити додаються щотижня.
Експерти попереджають про загрози приватності
Лі Драйбург, дослідник маркетингової видимості та засновник консалтингової компанії Contestra, попереджає про наслідки для приватності. “Переважна більшість користувачів не знає, що їхні чати перехоплюються з екранів, передаються через мережу, пакуються та перепродаються”, — зазначає він.
Profound не розкриває методи збору даних про чатботи. Вебсайт компанії лише зазначає, що вона “ліцензує розмови від кількох панелей реальних користувачів з подвійним підтвердженням згоди”.
Проте окрема аналітична компанія Semrush опублікувала у вересні дві статті, де згадувалося постачання даних користувачів для Profound. Згодом статті змінили, видаливши будь-які посилання на Profound.
Чи справді дані анонімні
Підрозділ Semrush під назвою Datos спеціалізується на ліцензуванні даних клієнтам в “анонімізованому” вигляді. Вебсайт Profound стверджує, що дані “анонімізовані, агреговані, очищені від особистої ідентифікаційної інформації та відповідають GDPR і CCA”.
Під час тестування виявилося, що Prompt Volumes дійсно редагує особисту інформацію. Наприклад, під час пошуку номерів соціального страхування, адрес, телефонів та приватних ключів система завжди видаляла їх. Проте Prompt Volumes показує, що Profound збирає конфіденційні запити користувачів про криптогаманці, паролі, номери соціального страхування та банківські рахунки.
Драйбург вважає, що бізнес-модель Profound порушує приватність користувачів, оскільки процес збору даних не пояснюється споживачам чітко. Він підозрює, що ключову роль у зборі даних відіграють розширення для браузерів, яким можна надати дозвіл переглядати всі вебсайти в браузері.
“ШІ-чати — це не короткі запити, це глибоко особисті зізнання. Користувачі ніколи свідомо не дають згоду на такий рівень спостереження”, — стверджує Драйбург. Він також ставить під сумнів, чи не порушує брак прозорості щодо збору даних європейські та каліфорнійські правила захисту даних.
Позиція правозахисників
Ліна Коен, технолог Electronic Frontier Foundation (EFF), погоджується: “Питання, які люди ставлять чатботам, можуть розкривати надзвичайно чутливу інформацію — про стан здоров’я, фінансові проблеми та стосунки”.
“Люди заслуговують на реальний контроль над тим, хто може отримати доступ до цих запитів до ШІ”, — зазначає вона. “Коли компанії дають розпливчасті запевнення, що люди погодилися на продаж своїх даних або що дані було ‘анонімізовано’, цього недостатньо для захисту людей. Компанії вже стверджували, що дані були анонімізовані та агреговані, але потім їх вдавалося відстежити до конкретних осіб”.
Коен додає: “Екосистема брокерів даних настільки непрозора, що люди практично не мають способу дізнатися, хто купує та продає їхні дані або як їх можуть використати проти них. Нам потрібне всеосяжне законодавство про приватність та суворіше правозастосування, щоб запити до ШІ залишалися приватними за замовчуванням”.
Реакція Profound
На запитання про занепокоєння приватністю Profound спочатку зазначила, що Драйбург є засновником і керівником “компанії-конкурента” Contestra, та назвала це “явною спробою завдати шкоди репутації бренду”.
“Profound не збирає жодних даних безпосередньо — ми ліцензуємо дані від відомих, авторитетних постачальників із підтвердженням згоди користувачів. Це ті самі постачальники, які десятиліттями живлять маркетингові та бізнес-аналітичні інструменти. Панелі споживачів із підтвердженням згоди існують понад століття — з епохи телебачення, коли Nielsen у 1923 році почав пропонувати дані для розуміння поведінки споживачів. Це нічим не відрізняється”, — заявила компанія.
Profound також заперечила показ конфіденційних тем через інструмент Prompt Volume, незважаючи на надані скріншоти. “Кілька запитів, які ми показуємо, — це не справжні запити користувачів, а використання великих мовних моделей для відображення ТИПУ запитів, які люди надсилають на будь-яку тему. Вік, дохід, стать тощо базуються на прогнозному моделюванні та не прив’язані до конкретних запитів”, — стверджує компанія.
У відповідь Драйбург зазначив, що в Contestra працює лише одна людина — він сам. Натомість Profound залучила понад 50 мільйонів доларів фінансування, має 82 співробітники та обслуговує “понад 1000” корпоративних клієнтів.
Драйбург також не погоджується з твердженням Profound про те, що Prompt Volumes не показує конфіденційні теми, оскільки власний вебсайт компанії рекламує сервіс словами: “Дізнайтеся, що мільйони людей запитують у ШІ”.
Драйбург повідомив, що отримав лист від юристів Profound із вимогою видалити його пости в LinkedIn з критикою компанії. “У разі якщо ви та Contestra не надасте підтвердження та продовжите поточний курс, Profound прямо залишає за собою всі права, включно з початком судового процесу без додaткового повідомлення”, — йдеться в листі.
Роль розширень для браузерів
Profound не розкрила, як користувачі дають згоду на збір даних про запити або як можна відмовитися від цього. Тому незрозуміло, які саме розширення для браузерів збирають дані користувачів.
Франк Лі, доцент кібербезпеки в Georgia Tech, минулого року разом зі своєю командою розробив автоматизовану систему під назвою Arcanum. Вона проаналізувала всі розширення в Chrome Store та виявила, що понад 3000 з них автоматично збирають специфічні для користувачів дані, наприклад URL-адреси. Підмножина з 200 розширень безпосередньо витягувала конфіденційні дані користувачів із вебсторінок.
Лі та його команда перевірили, чи може система Arcanum ідентифікувати розширення Chrome, які націлені на сайт ChatGPT та запити користувачів. Проте аналіз виявив лише 17 таких розширень, і лише одне мало понад 1000 користувачів.
“Вісім із 17 знайдених розширень витягували всю сторінку, решта — конкретно запит до ChatGPT, відповідь або обидва”, — розповів він.
Лі зазначив, що Arcanum мала два обмеження під час аналізу. Система не працювала з 20% розширень, які можуть функціонувати на ChatGPT, “значною мірою через те, що наша система використовує старішу версію браузера, а деякі з цих розширень, мабуть, використовують API, недоступний у старішій версії”.
Інша проблема полягає в тому, що Arcanum не працює з розширеннями, які потребують ручних дій, включно з входом в обліковий запис користувача — можливо, це ключовий спосіб, яким Datos та інші брокери даних отримують згоду користувачів.
Як захистити свою приватність
Щоб убезпечити себе від небажаного збору даних, експерти рекомендують кілька заходів:
- Перевірте встановлені розширення – регулярно переглядайте список розширень у вашому браузері та видаляйте ті, які вам не потрібні
- Читайте політики конфіденційності – перед встановленням розширення уважно вивчіть, які дані воно збирає
- Використовуйте режим інкогніто – для особливо делікатних запитів до ChatGPT
- Розгляньте альтернативні браузери – деякі браузери краще захищають приватність за замовчуванням
Коментарі компаній
Semrush не відповіла PCMag на запит про коментар. Проте Datos повідомила, що її збір даних є безпечним для приватності та відповідає закону, хоча компанія утрималася від пояснення, як саме користувачі дають згоду.
“Дані, які ми збираємо та передаємо нашим партнерам, використовуються для виявлення трендів в інтернеті та позбавлені будь-якої особистої інформації. Datos дуже серйозно ставиться до приватності, тому не збирає та не зберігає жодної особистої інформації. Datos використовує складні системи для запобігання потраплянню особистої інформації на наші сервери та залучає зовнішніх постачальників для моніторингу та забезпечення відсутності особистих даних”, — заявила компанія.
“Жоден з наших продуктів не отримав би користі від таких даних, і жоден клієнт ніколи не просив нас про це. Щодо способу збору даних — наші дані завжди збираються за знанням та згодою споживача, і споживач може відмовитися в будь-який момент”, — додала Datos.
OpenAI не відповіла на запит про коментар.
Висновок
Ситуація з відстеженням запитів до ChatGPT показує, наскільки важливо бути обережним з особистими даними в цифровому світі. Навіть коли ви думаєте, що спілкуєтеся приватно з AI, ваші дані можуть потрапити до третіх сторін через розширення браузера та інші інструменти відстеження.


