Переглядаючи цей сайт, ви погоджуєтесь з нашою політикою конфіденційності
Прийняти
Вівторок, 20 Тра, 2025
  • Про нас
  • Політика конфіденційності
  • Контакти
CyberCalm
  • Новини
    • Комп’ютери
    • Смартфони
    • Windows
    • Linux
    • Android
    • iOS
  • Кібербезпека
    КібербезпекаПоказати ще
    Поширені APT-загрози: російські кібератаки посилюються в Україні та ЄС
    Поширені APT-загрози: російські кібератаки посилюються в Україні та ЄС
    7 години тому
    Атака підміни SIM-картки: що це таке і як її уникнути?
    Атака підміни SIM-картки: що це таке і як її уникнути?
    15 години тому
    В кожній великій компанії присутні кібершпигуни
    В кожній великій компанії присутні кібершпигуни: актуальна загроза 2025 року
    4 дні тому
    Ці розширення для Chrome виглядають легально, але шпигують за користувачами
    Ці розширення для Chrome виглядають легально, але шпигують за користувачами
    4 дні тому
    GettyImages 925765688 scaled 1
    Російські хакери атакують державні установи й оборонні компанії в Україні та ЄС
    4 дні тому
  • Гайди та поради
    Гайди та поради
    Корисні поради, які допоможуть вам почуватися безпечно в мережі, а також маленькі хитрощі у користуванні вашими гаджетами.
    Показати ще
    Топ-новини
    Як перенести Telegram на інший телефон
    Як перенести Telegram на інший телефон. ІНСТРУКЦІЯ
    4 тижні тому
    telefon na androide 1
    Як знайти загублений смартфон Android?- ІНСТРУКЦІЯ
    1 місяць тому
    password computer
    Не зламати й за мільйон років: п’ять кроків для створення паролю
    1 місяць тому
    Останні новини
    Як блокувати піксельні трекери в електронній пошті: 4 прості методи
    11 години тому
    Як виявити програми для стеження на вашому ноутбуці
    4 дні тому
    У Windows є секретний метод аварійного перезавантаження. Як і коли ним користуватися?
    2 тижні тому
    7 хитрощів, щоб телефон прослужив якомога довше
    2 тижні тому
  • Статті
    Статті
    Цікаві статті про світ технологій, інтернет та кіберзахист. Розбираємо складні теми, від штучного інтелекту до безпеки даних та Big Data. Аналітика для допитливих та професіоналів.
    Показати ще
    Топ-новини
    brouser backdoor
    Як веб-додатки перетворюються на бекдори, дослідили французи
    1 місяць тому
    Найкращі Windows в історії: ТОП-10 найвидатніших версій
    Найкращі Windows в історії: ТОП-10 найвидатніших версій
    1 місяць тому
    hacker 26
    Вкрадені дані та цілі сервери: як працює тіньовий ринок кіберзлочинності?
    1 місяць тому
    Останні новини
    Реальність як розкіш: Як цифровізація суспільства створила дефіцит людського спілкування
    5 днів тому
    Цифрова розробка — стратегія для сучасного бізнесу
    6 днів тому
    Чи безпечно використовувати старі чи вживані телефони? Ось що ви повинні знати
    2 тижні тому
    7 фактів про смартфон, які ви, мабуть, не знали
    2 тижні тому
  • Огляди
    ОглядиПоказати ще
    Епоха Skype завершилася: Що далі? Огляд альтернативних сервісів
    Епоха Skype завершилася: Що далі? Огляд альтернативних сервісів
    2 тижні тому
    Найкращі бюджетні ноутбуки з Windows у 2025 році
    Найкращі бюджетні ноутбуки з Windows у 2025 році
    3 тижні тому
    Чистий Android: 10 переваг використання
    Що таке “чистий” Android та які переваги його використання?
    4 тижні тому
    galaxy xcover7 pro hero
    Нові витривалі смартфон і планшет Samsung: поєднання міцності та функцій ШІ
    1 місяць тому
    Смартфони Samsung – гідні рішення із різним функціоналом
    Смартфони Samsung – гідні рішення із різним функціоналом
    1 місяць тому
  • Майбутнє
    • Штучний інтелект
    • Робототехніка
    • Віртуальна реальність
    • Космос
Техногіганти
  • Google
  • Apple
  • Samsung
  • Microsoft
  • Meta
  • OpenAI
Соцмережі
  • Facebook
  • Instagram
  • YouTube
  • TikTok
  • X (Twitter)
  • Threads
Спеціальні теми
  • Кібервійна
  • Безпека дітей в Інтернеті
  • Маніпуляції в медіа
Читання: Вікіпедія пропонує розробникам ШІ навчальний набір даних, щоб позбутися ботів-скраперів
Розмір шрифтаAa
CyberCalmCyberCalm
Пошук
  • Новини
    • Комп’ютери
    • Смартфони
    • Соцмережі
    • Google
    • Android
    • Apple
    • Windows
    • Linux
    • Штучний інтелект
    • Безпека дітей в інтернеті
  • Кібербезпека
  • Гайди та поради
  • Статті
  • Огляди
Follow US
  • Про проєкт “Кібертиша”
  • Політика конфіденційності
  • Контакти
© 2025 Cybercalm. All Rights Reserved.
Головна / Новини / Вікіпедія пропонує розробникам ШІ навчальний набір даних, щоб позбутися ботів-скраперів

Вікіпедія пропонує розробникам ШІ навчальний набір даних, щоб позбутися ботів-скраперів

Енциклопедія бореться з впливом сканерів даних на її сервери.

Семенюк Валентин
1 місяць тому
Поширити
2 хв. читання
Вікіпедія пропонує розробникам ШІ навчальний набір даних

Вікіпедія бореться з впливом на її сервери ботів-сканувальників з ШІ, які витягують текст і мультимедіа з енциклопедії для навчання генеративних моделей штучного інтелекту, що в деяких випадках призводить до збільшення витрат і уповільнення часу завантаження для користувачів-людей.

Можливо, намагаючись зупинити ботів, які перевантажують загальнодоступний веб-сайт Вікіпедії і поглинають занадто багато пропускної здатності, Фонд Wikimedia (який управляє даними Вікіпедії) пропонує розробникам ШІ набір даних, якими вони можуть вільно користуватися.

Організація об’єдналася з Kaggle, платформою науки про дані, щоб запропонувати бета-версію структурованого набору даних англійською та французькою мовами. За словами компанії Google, якій належить Kaggle, набір даних відформатовано для машинного навчання, щоб зробити його більш корисним для навчання, розробки та науки про дані.

Також: Що таке ШІ-агенти? Як отримати доступ до команди персоналізованих помічників

Wikimedia Enterprise зазначає, що набір даних включає «анотації, короткі описи, дані ключ-значення в стилі інфобоксів, посилання на зображення і чітко сегментовані розділи статей». У ньому немає посилань або інших «непрозових елементів», таких як відеокліпи. Відсутність посилань може зробити питання атрибуції інформації в наборі даних дещо туманним. Однак Wikimedia Enterprise (частина Фонду Wikimedia, яка прагне зробити дані Вікіпедії доступними через API) заявляє, що вміст набору даних вільно ліцензований на умовах Creative Commons, є суспільним надбанням і т.д., оскільки все це взято з Вікіпедії.

ТЕМИ:ботВікіпедіямашинне навчаннянавчання ШІШтучний Інтелект
Поділитися
Facebook Threads Копіювати посилання Друк
Що думаєте?
В захваті0
Сумно0
Смішно0
Палає0
Овва!0
Попередня стаття Чому база даних CVE для відстеження вразливостей ледве не зникла Чому база даних CVE для відстеження вразливостей ледве не зникла — і що буде далі
Наступна стаття Президент Зеленський підписав ключовий закон про посилення кіберзахисту України Президент Зеленський підписав ключовий закон про посилення кіберзахисту України

В тренді

Атака підміни SIM-картки: що це таке і як її уникнути?
Атака підміни SIM-картки: що це таке і як її уникнути?
15 години тому
Поширені APT-загрози: російські кібератаки посилюються в Україні та ЄС
Поширені APT-загрози: російські кібератаки посилюються в Україні та ЄС
7 години тому
Як знайти та виправити вразливі паролі на вашому iPhone
Як знайти та виправити вразливі паролі на вашому iPhone
6 днів тому
В кожній великій компанії присутні кібершпигуни
В кожній великій компанії присутні кібершпигуни: актуальна загроза 2025 року
4 дні тому
Сплативши викуп хакерам, 80% організацій зазнають повторних атак
Сплативши викуп хакерам, 80% організацій зазнають повторних атак – ДОСЛІДЖЕННЯ
5 днів тому

Рекомендуємо

iOS 19 може допомогти акумулятору вашого iPhone працювати цілий день завдяки штучному інтелекту
Новини

iOS 19 може допомогти акумулятору вашого iPhone працювати цілий день завдяки штучному інтелекту

6 днів тому
Chrome тепер використовуватиме Gemini Nano для виявлення шахраїв
Кібербезпека

Chrome тепер використовуватиме Gemini Nano для виявлення шахраїв

2 тижні тому
Google випускає Gemini для дітей, але з батьківським контролем
Новини

Google випускає Gemini для дітей, але з батьківським контролем

3 тижні тому
OpenAI відкочує оновлення, через яке ChatGPT поводився дивно
Новини

OpenAI відкочує оновлення, через яке ChatGPT поводився дивно

3 тижні тому
CyberCalmCyberCalm
Follow US
© 2025 Cybercalm. All Rights Reserved.
  • Про проєкт “Кібертиша”
  • Політика конфіденційності
  • Контакти
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?