Переглядаючи цей сайт, ви погоджуєтесь з нашою політикою конфіденційності
Прийняти
Середа, 11 Чер, 2025
  • Про нас
  • Політика конфіденційності
  • Контакти
CyberCalm
  • Новини
  • Кібербезпека
    КібербезпекаПоказати ще
    Створили та забули: у чому небезпека неактивних облікових записів
    Створили та забули: у чому небезпека неактивних облікових записів
    2 дні тому
    Шкідливе ПЗ Myth Stealer полює на геймерів через фейкові ігрові сайти
    Шкідливе ПЗ Myth Stealer полює на геймерів через фейкові ігрові сайти
    2 дні тому
    Як дізнатися, чи кнопка завантаження на сайті справжня
    Як дізнатися, чи кнопка завантаження на сайті справжня
    1 тиждень тому
    Телеметрія Firefox: як дізнатися, які дані про вас збирає браузер
    Телеметрія Firefox: як дізнатися, які дані про вас збирає браузер
    1 тиждень тому
    Тайм трекер онлайн як інструмент кібербезпеки: 5 загроз які він допомагає виявити
    Тайм трекер онлайн як інструмент кібербезпеки: 5 загроз які він допомагає виявити
    2 тижні тому
  • Гайди та поради
    Гайди та поради
    Корисні поради, які допоможуть вам почуватися безпечно в мережі, а також маленькі хитрощі у користуванні вашими гаджетами.
    Показати ще
    Топ-новини
    Як перенести Telegram на інший телефон
    Як перенести Telegram на інший телефон. ІНСТРУКЦІЯ
    2 місяці тому
    Як вимкнути відстеження вашого місцезнаходження на iPhone?
    Як вимкнути відстеження вашого місцезнаходження на iPhone? – ІНСТРУКЦІЯ
    2 місяці тому
    Забули пароль від Wi-Fi? 5 способів дізнатися його
    Роутер у безпеці: як перевірити оновлення прошивки?
    2 місяці тому
    Останні новини
    Як захистити паролем фотографії на iPhone та iPad
    5 днів тому
    Як вимкнути Gemini у Gmail, Google Диску, Фото та інших сервісах
    5 днів тому
    Як захистити WhatsApp Web паролем: повний посібник з безпеки
    6 днів тому
    Телефон Android не приймає дзвінки? Ось як це виправити!
    1 тиждень тому
  • Статті
    Статті
    Цікаві статті про світ технологій, інтернет та кіберзахист. Розбираємо складні теми, від штучного інтелекту до безпеки даних та Big Data. Аналітика для допитливих та професіоналів.
    Показати ще
    Топ-новини
    Історія Caps Lock: Чому ця функція існує
    Історія Caps Lock: Чому ця функція існує?
    2 місяці тому
    4 технології, які намагаються замінити ваш смартфон
    4 технології, які намагаються замінити ваш смартфон
    2 місяці тому
    Як відрізнити людину від бота в чаті? Ось 6 ознак, що ви спілкуєтесь зі штучним інтелектом
    Як відрізнити людину від бота в чаті? Ось 6 ознак, що ви спілкуєтесь зі штучним інтелектом
    2 місяці тому
    Останні новини
    iOS 26 замість iOS 19: як Apple спростила найменування своїх операційних систем
    3 години тому
    Наскільки шкідливі перебої в електропостачанні для моїх гаджетів?
    1 день тому
    Квантово-захищене шифрування даних: як його розвиток зможе посилити нацбезпеку країн
    6 днів тому
    Чому Google знищує інформаційні сайти: Як пошуковий гігант переписує правила Інтернету
    1 тиждень тому
  • Огляди
    ОглядиПоказати ще
    WWDC 2025: Apple представила iOS 26, оновлення інтерфейсу та революційну багатозадачність iPad
    WWDC 2025: Apple представила iOS 26, оновлення інтерфейсу та революційну багатозадачність iPad
    1 день тому
    Модель Claude Opus 4 від Anthropic
    Модель Claude Opus 4 від Anthropic може працювати автономно майже цілий робочий день
    3 тижні тому
    Як спробувати Veo 3
    Як спробувати Veo 3, ШІ-генератор відео від Google, який стає вірусним в інтернеті
    3 тижні тому
    gemini live running on a google pixel 9
    Google Gemini отримує 8 корисних функцій – ось що нового
    3 тижні тому
    Епоха Skype завершилася: Що далі? Огляд альтернативних сервісів
    Епоха Skype завершилася: Що далі? Огляд альтернативних сервісів
    1 місяць тому
  • Теми
    • Комп’ютери
    • Смартфони
    • Windows
    • Linux
    • Android
    • iOS
    • Штучний інтелект
    • Розумний будинок
  • Архів
Техногіганти
  • Google
  • Apple
  • Samsung
  • Microsoft
  • Meta
  • OpenAI
Соцмережі
  • Facebook
  • Instagram
  • YouTube
  • TikTok
  • X (Twitter)
  • Threads
Спеціальні теми
  • Кібервійна
  • Безпека дітей в Інтернеті
  • Маніпуляції в медіа
Читання: Пошукові системи зі штучним інтелектом можуть давати неправильні результати до 76% часу, – Дослідження
Розмір шрифтаAa
CyberCalmCyberCalm
Пошук
  • Новини
    • Комп’ютери
    • Смартфони
    • Соцмережі
    • Google
    • Android
    • Apple
    • Windows
    • Linux
    • Штучний інтелект
    • Безпека дітей в інтернеті
  • Кібербезпека
  • Гайди та поради
  • Статті
  • Огляди
  • Архів
Follow US
  • Про проєкт “Кібертиша”
  • Політика конфіденційності
  • Контакти
© 2025 Cybercalm. All Rights Reserved.
Головна / Статті / Пошукові системи зі штучним інтелектом можуть давати неправильні результати до 76% часу, – Дослідження

Пошукові системи зі штучним інтелектом можуть давати неправильні результати до 76% часу, – Дослідження

Наталя Зарудня
ByНаталя Зарудня
Головний редактор
Досвід роботи у галузі кібербезпеки понад 10 років. Пишу про штучний інтелект, соціальні мережі, історію технологій.
Слідкуйте:
3 місяці тому
Поширити
6 хв. читання
Пошукові системи зі штучним інтелектом можуть давати неправильні результати до 76% часу, - Дослідження
Joe Fedewa / How-To Geek

Ми всі чули застереження: «Не довіряйте всьому, що говорить штучний інтелект!» Але наскільки неточними є пошукові системи зі штучним інтелектом? Співробітники Tow Center for Digital Journalism провели комплексне тестування восьми популярних пошукових систем зі штучним інтелектом, і результати виявилися приголомшливими.

Зміст
Як проводилися тестиНе просто неправильно, а «впевнено» неправильноЛіцензійні угоди та заблокований доступ не мають значення

Як проводилися тести

Перш за все, давайте поговоримо про те, як Tow Center перевіряв ці пошукові системи. Вісім чат-ботів, які брали участь у дослідженні, включали як безкоштовні, так і преміум-моделі з функцією живого пошуку (можливість доступу до живого інтернету):

  • ChatGPT Search
  • Perplexity
  • Perplexity Pro
  • DeepSeek Search
  • Microsoft Copilot
  • Grok-2 Search
  • Grok-3 Search
  • Google Gemini

Це дослідження стосувалося насамперед здатності чат-ботів зі штучним інтелектом точно знаходити та цитувати новинний контент. Центр також хотів побачити, як чат-боти поводяться, коли вони не можуть виконати запитувану команду.

Щоб перевірити все це, було відібрано 10 статей від 10 різних видавництв. Потім з кожної статті були вибрані уривки і надані кожному чат-боту. Потім вони попросили чат-бота виконати прості завдання, такі як визначення заголовка статті, оригінального видавця, дати публікації та URL-адреси.

Ось ілюстрація того, як це виглядало.

Приклад запиту для пошукових систем зі штучним інтелектом
Приклад запиту для пошукових систем зі штучним інтелектом

Відповіді чат-бота були поміщені в одне з шести відер:

  • Correct (Правильно): Всі три атрибути були правильними.
  • Correct But Incomplete (Правильно, але не повністю): Деякі атрибути були правильними, але у відповіді бракувало інформації.
  • Partially Incorrect (Частково неправильно): деякі атрибути були правильними, а інші – неправильними.
  • Completely Incorrect (Повністю неправильно): Усі три атрибути були неправильними та/або відсутніми.
  • Not Provided (Не надано): Інформація не була надана.
  • Crawler Blocked (Заблоковано): Видавець заборонив пошуковий робот чат-бота у своєму файлі robots.txt.

Не просто неправильно, а «впевнено» неправильно

Як ви побачите, пошукові системи зі штучним інтелектом помилялися частіше, ніж ні, але, мабуть, більша проблема полягає в тому, як вони помилялися. Незалежно від точності, чат-боти майже завжди відповідають впевнено. Дослідження показало, що вони рідко використовують уточнюючі фрази на кшталт «це можливо» або визнають, що не можуть виконати команду. Частково це можна пояснити галюцинуванням штучного інтелекту.

Точність і впевненість пошукової системи з ШІ
Точність і впевненість пошукової системи з ШІ

На графіку вище показано точність відповідей, а також впевненість, з якою вони були надані. Як бачите, майже всі відповіді знаходяться в зоні «Впевнено», але є багато червоного кольору.

Наприклад, Grok-3 показав, що 76% відповідей «впевнено неправильні» або «частково неправильні». Майте на увазі, що Grok-3 – це преміум-модель, і вона показала гірші результати, ніж попередня версія Grok-2.

Преміум-чат-бот проти безкоштовного чат-бота
Преміум-чат-бот проти безкоштовного чат-бота

Те ж саме можна побачити і з Perplexity Pro проти Perplexity. Плата за преміум-модель – $20 на місяць у випадку Perplexity Pro – не обов’язково покращує точність, але вона, здається, більш впевнена навіть в тому, що може бути помилкою.

Ліцензійні угоди та заблокований доступ не мають значення

Деякі пошукові системи зі штучним інтелектом мають ліцензійні угоди, які дозволяють їм отримувати доступ до певних публікацій. Можна припустити, що чат-боти будуть чудово ідентифікувати інформацію з цих публікацій, але це не завжди так.

Також: Чат-боти зі штучним інтелектом спотворюють новини, виявила BBC

На діаграмі нижче показано вісім чат-ботів і видавництво, з яким вони уклали ліцензійну угоду. Нагадуємо, що їх попросили визначити заголовок статті, оригінального видавця, дату публікації та URL-адресу. Більшість чат-ботів змогли зробити це з високим рівнем точності, але деякі не змогли. Наприклад, ChatGPT Search помилявся в 90% випадків, коли мав справу з San Francisco Chronicle, виданням, з яким у нього є партнерські відносини.

Чат-боти та угоди з видавцями
Чат-боти та угоди з видавцями

З іншого боку, деякі видання заблокували доступ до свого контенту пошуковим системам зі штучним інтелектом. Однак дослідження показало, що на практиці це не завжди спрацьовує. Деякі пошукові системи, схоже, не поважали блокування.

Perplexity, наприклад, зміг точно ідентифікувати всі 10 цитат з National Geographic, незважаючи на те, що він є платним і блокує пошукових роботів. Але це лише в правильних відповідях. Ще більше чат-ботів не тільки отримували доступ до заблокованих сайтів, але й надавали неточну інформацію з них. Grok і DeepSeek не показані на графіку, оскільки вони не розкривають своїх пошукових роботів.

Чат-боти та заблоковані пошукові роботи
Чат-боти та заблоковані пошукові роботи

Отже, що все це означає для вас? Очевидно, що покладатися на точність пошуку виключно на пошукові системи зі штучним інтелектом – ризиковано. Навіть преміум-моделі з ліцензійними угодами можуть впевнено поширювати дезінформацію. Це суворе нагадування про те, що критичне мислення та перехресні посилання залишаються важливими навичками в епоху ШІ.

Не забудьте ознайомитися з повним текстом дослідження в Columbia Journalism Review, щоб дізнатися більше цікавих (і тривожних) висновків.

О, привіт 👋
Приємно познайомитися!

Підпишіться, щоб щотижня отримувати чудовий контент на свою поштову скриньку.

Ми не розсилаємо спам! Ознайомтеся з нашою політикою конфіденційності для отримання додаткової інформації.

Перевірте свою поштову скриньку або папку зі спамом, щоб підтвердити підписку.

ТЕМИ:ChatGPT SearchCopilotDeepSeekGeminiGrokPerplexityпошукова системаШтучний Інтелект
ДЖЕРЕЛО:How-To Geek
Поділитися
Facebook Threads Копіювати посилання Друк
Що думаєте?
В захваті0
Сумно0
Смішно0
Палає0
Овва!0
Попередня стаття Як змінити мову в App Store Як змінити мову в App Store
Наступна стаття Google Lens: 7 способів використання цього дивовижного інструменту для обробки зображень Google Lens: 7 способів використання цього інструменту для обробки зображень

В тренді

Як захистити паролем фотографії на iPhone та iPad
Як захистити паролем фотографії на iPhone та iPad
5 днів тому
Як захистити WhatsApp Web паролем: повний посібник з безпеки
Як захистити WhatsApp Web паролем: повний посібник з безпеки
6 днів тому
Наскільки шкідливі перебої в електропостачанні для моїх гаджетів?
Наскільки шкідливі перебої в електропостачанні для моїх гаджетів?
1 день тому
Створили та забули: у чому небезпека неактивних облікових записів
Створили та забули: у чому небезпека неактивних облікових записів
2 дні тому
Ваш смартфон отримає 4 великі оновлення з Android 16
Ваш смартфон отримає 4 великі оновлення з Android 16
5 години тому

Рекомендуємо

WWDC 2025: Apple представила iOS 26, оновлення інтерфейсу та революційну багатозадачність iPad
Огляди

WWDC 2025: Apple представила iOS 26, оновлення інтерфейсу та революційну багатозадачність iPad

1 день тому
Як вимкнути Gemini у Gmail, Google Диску, Фото та інших сервісах
Гайди та поради

Як вимкнути Gemini у Gmail, Google Диску, Фото та інших сервісах

5 днів тому
Reddit подав позов проти Anthropic за нібито незаконне використання його даних
Новини

Reddit подав позов проти Anthropic за нібито незаконне використання його даних

6 днів тому
Perplexity AI незабаром з'явиться на пристроях Samsung
Новини

Perplexity AI незабаром з’явиться на пристроях Samsung

1 тиждень тому
CyberCalmCyberCalm
Follow US
© 2025 Cybercalm. All Rights Reserved.
  • Про проєкт “Кібертиша”
  • Політика конфіденційності
  • Контакти
Cybercalm
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?