Гучна доповідь про зростання відвідуваності церков у Британії виявилася побудованою на сфальсифікованих даних. Цей випадок став приводом для серйозного застереження з боку науковців: онлайн-опитування дедалі частіше стають мішенню для маніпуляцій із застосуванням штучного інтелекту, а довіра до соціологічних досліджень опинилася під загрозою.
Церковне «відродження», якого не було
Упродовж певного часу британські медіа активно поширювали новини про зростання кількості парафіян у церквах — зокрема серед молоді. Публікації посилалися на доповідь Bible Society 2024 року, підготовлену на основі даних опитування компанії YouGov. Результати набули широкого розголосу й сформували стійкий наратив про релігійне відродження в Англії та Уельсі.
Однак згодом з’ясувалося, що дані опитування були визнані «сфальсифікованими» й відкликані. Науковці та експерти застерігають: цей випадок є симптомом значно ширшої проблеми, пов’язаної зі штучним інтелектом.
Як ШІ підробляє відповіді в анкетах
Дослідники фіксують тривожну тенденцію: онлайн-опитування з відкритою реєстрацією (так звані opt-in surveys) дедалі більше заповнюються фіктивними відповідями. Учасники, які отримують невелику оплату за заповнення анкет, використовують інструменти штучного інтелекту для масового й автоматизованого проходження опитувань.
Шон Вествуд, доцент кафедри державного управління Дартмутського коледжу (штат Нью-Гемпшир, США), пояснює масштаб загрози: «Базове припущення соціологічних досліджень — що відповідає реальна людина, яка дає послідовні й логічні відповіді — тепер зруйноване».
За його словами, ШІ-моделі становлять екзистенційну загрозу для розуміння суспільства. «Агент може бути налаштований на маніпуляцію. Одного речення інструкції достатньо, щоб систематично викривляти відповіді в політичних або геополітичних опитуваннях — при цьому демографічний профіль залишається нетронутим, і маніпуляція є невидимою для стандартних перевірок», — зазначає Вествуд.
Навіть без прямої вказівки «шахраювати» ШІ здатен самостійно здогадатися, що саме перевіряє дослідник, і сформувати дані, які підтверджують гіпотезу. При цьому точний масштаб проблеми лишається невідомим — що само по собі є частиною проблеми, наголошує Вествуд.
Окремою складністю є швидкість розвитку технологій. «Дослідник може розробити хитру нову пастку, яка виявляє сьогоднішні моделі — але розвиток ШІ рухається так швидко, що це рішення, швидше за все, застаріє за кілька місяців», — попереджає науковець.
Чому молодь — найзручніша мішень для фальсифікацій
Кортні Кеннеді, віцепрезидент із методології та інновацій Pew Research Center, звертає увагу на специфічний аспект: у відкритих опитуваннях дані про людей молодше 30 років містять особливо високий рівень похибки й частіше походять із так званих «клік-ферм».
«Люди, що добре вміють користуватися інтернетом і приховувати свою особу, загалом молодші. Фіктивні учасники прагнуть проходити якомога більше опитувань. У галузі добре відомо, що залучити молодих дорослих до опитувань складно — тому вигідно представляти себе молодим, адже саме таких респондентів зазвичай бракує», — пояснює Кеннеді.
Вона також вказує на так звану «позитивну упередженість»: фіктивні респонденти схильні відповідати ствердно на будь-яке запитання, що штучно завищує показники.
Проблема виходить за межі одного випадку
Девід Воас, кількісний соціолог та почесний професор Університетського коледжу Лондона, наголошує, що проблема з доповіддю Bible Society полягала не лише у сфальсифікованих відповідях. Не менш важливою помилкою була відсутність критичного зіставлення даних YouGov з іншими доступними дослідженнями — зокрема з даними самих церков.
«Якби це було серйозне наукове дослідження, потрібно було б переглянути літературу й з’ясувати, які ще докази існують», — зазначає Воас.
На його думку, небезпека полягає і в тому, що хибна інформація поширюється значно легше, ніж її можна спростувати. «Зусиль для спростування потрібно на порядок більше, ніж для початкового поширення. Ми бачимо, як підривається довіра до таких опитувань — і повернути її дуже складно», — каже науковець.
Воас підкреслює: проблема не є специфічною для YouGov — вона притаманна всій галузі. Зростання масштабів пов’язане з економічними стимулами: учасники, що діють у великих обсягах, здатні генерувати відчутний дохід навіть за невисокими тарифами оплати.
Як YouGov намагається протидіяти
Представник YouGov повідомив виданню The Guardian, що компанія використовує метод випадкової вибірки: учасники не можуть самостійно обирати, яке опитування проходити. «Ми самі вирішуємо, кому надсилати опитування, тому немає способу вступити до панелі, щоб вплинути на результат дослідження», — пояснив речник.
Для виявлення зловживань компанія застосовує перевірку особи, «цифровий відбиток» пристрою, геолокацію з кількох джерел, оцінку загроз у реальному часі та контроль виплат. «Зростання організованих ферм опитувань, ботів і тепер ШІ-відповідей робить виявлення життєво важливою, постійною й постійно еволюціонуючою дисципліною», — зазначив представник YouGov.

