Галюцинації є невід’ємною вадою ШІ-чатботів. Коли ChatGPT, Gemini, Copilot чи інші моделі штучного інтелекту видають неправдиву інформацію, незалежно від того, наскільки впевнено це звучить — це галюцинація. Штучний інтелект може галюцинувати незначне відхилення, нешкідливу на перший погляд помилку або висловити відверто наклепницьке та повністю вигадане звинувачення. У будь-якому випадку, такі ситуації неминуче виникатимуть, якщо ви достатньо довго взаємодієте з ChatGPT або його конкурентами.
Розуміння того, як і чому ChatGPT може сплутати правдоподібне з правдивим, є критично важливим для всіх, хто бажає спілкуватися зі штучним інтелектом. Оскільки ці системи генерують відповіді, прогнозуючи, який текст має з’явитися наступним на основі патернів у навчальних даних, а не перевіряючи достовірність інформації, вони можуть звучати переконливо реалістично, будучи повністю вигаданими. Секрет полягає в тому, щоб усвідомлювати можливість появи галюцинації в будь-який момент і шукати ознаки того, що вона ховається прямо перед вами.
Незвичайна конкретність без перевірених джерел
Одна з найдратівливіших особливостей галюцинацій штучного інтелекту полягає в тому, що вони часто містять начебто конкретні деталі. Сфабрикована відповідь може містити дати, імена та інші подробиці, які надають їй правдоподібності. Оскільки ChatGPT генерує текст, який нагадує патерни, засвоєні під час навчання, він може створювати деталі, що відповідають структурі правильної відповіді, але при цьому не посилатися на реальне джерело.
Користувач може запитати про когось і побачити реальні фрагменти персональної інформації про цю особу, змішані з повністю вигаданою розповіддю. Така конкретність ускладнює виявлення галюцинації, оскільки люди схильні довіряти детальним твердженням.
Проте критично важливо перевіряти будь-які з цих деталей, які можуть створити проблеми в разі помилки. Якщо згадані дата, стаття чи особа не з’являються в інших місцях, це ознака того, що ви, можливо, маєте справу з галюцинацією. Слід пам’ятати, що генеративний ШІ не має вбудованого механізму перевірки фактів — він просто прогнозує, що може бути правдоподібним, а не те, що є правдою.
Невиправдана впевненість
Пов’язаною з пасткою конкретності є надмірно впевнений тон багатьох галюцинацій штучного інтелекту. ChatGPT та подібні моделі розроблені для представлення відповідей у плавному, авторитетному тоні. Ця впевненість може змусити дезінформацію здаватися достовірною навіть тоді, коли базове твердження є безпідставним.
Моделі ШІ оптимізовані для прогнозування ймовірних послідовностей слів. Навіть коли штучний інтелект має бути обережним щодо того, що він пише, він представить інформацію з тією ж упевненістю, що й коректні дані. На відміну від людини-експерта, яка може застерегти або сказати «я не впевнений», для моделі ШІ все ще незвичайно, хоча останнім часом це стає більш поширеним, сказати «я не знаю». Це відбувається тому, що повноцінна відповідь створює видимість повноти, а не чесність щодо невизначеності.
У будь-якій галузі, де самі експерти висловлюють невпевненість, слід очікувати, що надійна система відобразить це. Наприклад, наука та медицина часто містять дискусії або теорії, що розвиваються, де остаточні відповіді є невловимими. Якщо ChatGPT відповідає категоричним твердженням на такі теми, декларуючи єдину причину або загальноприйнятий факт, ця впевненість може насправді сигналізувати про галюцинацію, оскільки модель заповнює прогалину в знаннях вигаданою розповіддю, а не вказує на спірні аспекти.
Неперевірені цитати
Цитати та посилання є чудовим способом підтвердити, чи є правдивим те, що каже ChatGPT. Але іноді система надасть те, що виглядає як легітимні посилання, за винятком того, що ці джерела насправді не існують.
Цей тип галюцинації є особливо проблематичним в академічному або професійному контексті. Студент може побудувати огляд літератури на основі фальшивих цитат, які виглядають бездоганно відформатованими, з правдоподібними назвами журналів. Потім з’ясовується, що робота ґрунтується на фундаменті посилань, які неможливо відстежити до перевірених публікацій.
Експерти рекомендують завжди перевіряти, чи можна знайти цитовану статтю, автора або журнал у авторитетних академічних базах даних або через прямий веб-пошук. Якщо назва здається дивно конкретною, але не дає результатів пошуку, це цілком може бути «фантомним цитуванням», створеним моделлю для надання відповіді авторитетності.
Суперечливі подальші відповіді
Впевнено стверджені заяви з реальними посиланнями — це чудово, але якщо ChatGPT суперечить сам собі, щось все ще може бути не так. Саме тому корисні додаткові запитання. Оскільки генеративний ШІ не має вбудованої бази даних фактів, яку він перевіряє для узгодженості, він може суперечити сам собі при подальшому зондуванні. Це часто проявляється, коли користувач ставить додаткове запитання, яке зосереджується на попередньому твердженні. Якщо нова відповідь відрізняється від першої таким чином, що їх неможливо узгодити, одна або обидві відповіді, ймовірно, є галюцинаціями.
На щастя, не потрібно виходити за межі розмови, щоб виявити цей індикатор. Якщо модель не може підтримувати послідовні відповіді на логічно пов’язані запитання в межах одного діалогу, початкова відповідь, ймовірно, з самого початку не мала фактичної основи.
Нелогічні міркування
Навіть якщо внутрішня логіка не суперечить сама собі, логіка ChatGPT може здаватися сумнівною. Якщо відповідь не узгоджується з реальними обмеженнями, варто звернути на це увагу. ChatGPT пише текст, прогнозуючи послідовності слів, а не застосовуючи фактичну логіку, тому те, що здається раціональним у реченні, може розсипатися при розгляді в реальному світі.
Зазвичай це починається з хибних припущень. Наприклад, штучний інтелект може запропонувати додати неіснуючі кроки до добре встановленого наукового протоколу або порушити базовий здоровий глузд. Як це сталося з Gemini, модель ШІ запропонувала використовувати клей у соусі для піци, щоб сир краще прилипав. Звісно, він може краще прилипати, але як кулінарна інструкція це не зовсім висока кухня.
Галюцинації як наслідок навчання ШІ
Галюцинації в ChatGPT та подібних мовних моделях є побічним продуктом того, як ці системи навчаються. Тому галюцинації, ймовірно, збережуться, доки штучний інтелект будуватиметься на прогнозуванні слів.
Хитрість для користувачів полягає в навчанні того, коли довіряти результату, а коли перевіряти його. Виявлення галюцинації стає дедалі важливішою навичкою цифрової грамотності. У міру того, як ШІ стає більш широко використовуваним, логіка та здоровий глузд набуватимуть критичного значення. Найкращий захист — це не сліпа довіра, а інформована перевірка.

