Переглядаючи цей сайт, ви погоджуєтесь з нашою політикою конфіденційності
Прийняти
  • Про нас
  • Політика конфіденційності
  • Контакти
CyberCalm
  • Кібербезпека
    КібербезпекаПоказати ще
    Ці розширення для Chrome виглядають легально, але шпигують за користувачами
    Критична вразливість Chrome дозволяє шкідливим розширенням шпигувати за користувачами через Gemini
    4 дні тому
    Чому шахраї телефонують і мовчать — і як реагувати безпечно
    Чому шахраї телефонують і мовчать — і як реагувати безпечно
    5 днів тому
    Новий ботнет Kimwolf загрожує смарт-телевізорам на Android
    Новий ботнет Kimwolf загрожує смарт-телевізорам на Android
    6 днів тому
    Трояни: що це таке, якими бувають та як від них захиститися
    Трояни: що це таке, якими бувають та як від них захиститися
    1 тиждень тому
    GetContact: чому цей додаток небезпечний для українців і як видалити свій номер з бази
    Чому GetContact небезпечний для українців і як видалити свій номер з бази
    1 тиждень тому
  • Гайди та поради
    Гайди та поради
    Корисні поради, які допоможуть вам почуватися безпечно в мережі, а також маленькі хитрощі у користуванні вашими гаджетами.
    Показати ще
    Топ-новини
    Як перенести Telegram на інший телефон
    Як перенести Telegram на інший телефон. ІНСТРУКЦІЯ
    11 місяців тому
    ШІ Gemini з'являється в Google Календарі - ось що він вміє і як його випробувати
    ШІ Gemini з’являється в Google Календарі – ось що він вміє і як його випробувати
    11 місяців тому
    Galaxy S24 official AI features 2
    Самодіагностика смартфона: програми, які врятують Ваш ґаджет Android
    3 місяці тому
    Останні новини
    «Супровід» на iPhone: функція безпеки iOS, яка сама повідомить рідних, якщо ви не добралися додому
    1 день тому
    Рандомізація MAC-адреси: як захистити смартфон від відстеження в публічних Wi-Fi мережах
    2 дні тому
    Хочете перейти з ChatGPT на Claude? Ось 5 речей, які потрібно знати
    3 дні тому
    Весняне прибирання ПК: 12 кроків для повного очищення комп’ютера
    3 дні тому
  • Статті
    Статті
    Цікаві статті про світ технологій, інтернет та кіберзахист. Розбираємо складні теми, від штучного інтелекту до безпеки даних та Big Data. Аналітика для допитливих та професіоналів.
    Показати ще
    Топ-новини
    Для яких завдань потрібен VDS сервер: реальні приклади та особистий досвід
    Для яких завдань потрібен VDS сервер: реальні приклади та особистий досвід
    4 місяці тому
    Які послуги входять в обслуговування орендованого сервера
    Які послуги входять в обслуговування орендованого сервера
    3 місяці тому
    5G в Україні: коли запрацює мережа майбутнього та що заважає її розгортанню
    5G в Україні: коли запрацює мережа майбутнього та що заважає її розгортанню
    3 місяці тому
    Останні новини
    Інші фронти Європи: іноземні гібридні загрози в ЄС
    1 день тому
    Індустрія фейків за копійки: звіт НАТО розкриває, як ШІ та крипта допомагають ботофермам
    2 дні тому
    Статистика кібербезпеки в Європі-2025: Зростає кількість потужних атак типу «carpet bombing»
    3 дні тому
    Як розпізнати «руку Кремля»: методи виявлення та атрибуції російських інформаційних операцій
    3 дні тому
  • Огляди
    ОглядиПоказати ще
    Apple MacBook Neo: огляд доступного ноутбука за $599
    Apple MacBook Neo: огляд доступного ноутбука за $599
    5 години тому
    Nearby Glasses: Android-застосунок для виявлення смарт-окулярів поблизу
    Nearby Glasses: Android-застосунок для виявлення смарт-окулярів поблизу
    1 тиждень тому
    FreeOffice — безкоштовна альтернатива Microsoft Office для Windows, macOS, Linux та мобільних пристроїв
    FreeOffice — безкоштовна альтернатива Microsoft Office для Windows, macOS, Linux та мобільних пристроїв
    2 тижні тому
    Kali Linux проти Parrot OS: який дистрибутив краще для кібербезпеки?
    Kali Linux проти Parrot OS: який дистрибутив краще для кібербезпеки?
    1 місяць тому
    Гнучкі смартфони: еволюція чи дорогий експеримент? Огляд провідних моделей
    Гнучкі смартфони: еволюція чи дорогий експеримент? Огляд провідних моделей
    1 місяць тому
  • Техногіганти
    • Google
    • Apple
    • Microsoft
    • Meta
    • OpenAI
    • Anthropic
    • xAI
    • Samsung
  • Теми
    • Комп’ютери
    • Смартфони
    • Електронна пошта
    • Windows
    • Linux
    • Android
    • iPhone
    • VPN
    • Штучний інтелект
    • Робототехніка
Соцмережі
  • Facebook
  • Instagram
  • YouTube
  • TikTok
  • X (Twitter)
  • Threads
Спеціальні теми
  • Кібервійна
  • Маніпуляції в медіа
  • Дезінформація
  • Безпека дітей в Інтернеті
  • Розумний будинок
Інше
  • Сканер безпеки сайту
  • Архів
Читання: Команда Grok вибачається за “жахливу поведінку” чатбота і звинувачує погане оновлення в появі “МехаГітлера”
Розмір шрифтаAa
CyberCalmCyberCalm
Пошук
  • Техногіганти
    • Комп’ютери
    • Смартфони
    • Соцмережі
    • Google
    • Android
    • Apple
    • Windows
    • Linux
    • Штучний інтелект
    • Безпека дітей в інтернеті
  • Кібербезпека
  • Гайди та поради
  • Статті
  • Огляди
  • Сканер безпеки сайту
  • Архів
Follow US
  • Про проєкт Cybercalm
  • Політика конфіденційності
  • Контакти
© 2025 Cybercalm. All Rights Reserved.
Головна / Техногіганти / Команда Grok вибачається за “жахливу поведінку” чатбота і звинувачує погане оновлення в появі “МехаГітлера”

Команда Grok вибачається за “жахливу поведінку” чатбота і звинувачує погане оновлення в появі “МехаГітлера”

Техногіганти
8 місяців тому
Поширити
4 хв. читання
Команда Grok вибачається за "жахливу поведінку" чатбота і звинувачує погане оновлення в появі "МехаГітлера"

Команда, що стоїть за Grok, опублікувала вибачення та пояснення того, що пішло не так після того, як чатбот X почав поширювати антисемітську та пронацистську риторику на початку цього тижня, навіть називаючи себе “МехаГітлером”.

У заяві, опублікованій в акаунті Grok на X пізно у п’ятницю ввечері, команда xAI заявила: “ми щиро вибачаємося за жахливу поведінку, з якою зіткнулися багато людей” і пояснила огидні відповіді чатбота нещодавнім оновленням, яке ввело “застарілий код”. Цей код, згідно з заявою, зробив Grok “схильним до існуючих постів користувачів X, включаючи випадки, коли такі пости містили екстремістські погляди”.

1ef50520 5f4d 11f0 9cfd ba5df6a1ea03

Проблема досягла піку 8 липня — через кілька днів після того, як Ілон Маск розрекламував оновлення, яке мало “значно” покращити відповіді Grok — коли бот почав видавати антисемітські відповіді, хвалити Гітлера та відповіді з нацистськими посиланнями навіть без відповідних підказок у деяких випадках. Відповіді Grok були призупинені того вечора, а Маск написав 9 липня у відповідь одному користувачеві, що бот був “занадто поступливим до підказок користувачів”, відкриваючи його для маніпуляцій. Він додав, що проблема “вирішується”. Команда Grok тепер каже, що “видалила цей застарілий код і рефакторила всю систему, щоб запобігти подальшим зловживанням”. Вона також публікує новий системний промпт на GitHub.

- Advertisement -

У цій темі команда далі пояснила: “7 липня 2025 року приблизно о 23:00 за тихоокеанським часом було реалізовано оновлення вищого шляху коду для Grok, яке, як згодом визначило наше розслідування, спричинило відхилення системи Grok від її передбачуваної поведінки. Ця зміна небажано змінила поведінку Grok, несподівано включивши набір застарілих інструкцій, що вплинуло на те, як функціональність Grok інтерпретувала пости користувачів X”. Оновлення працювало 16 годин до того, як чатбот X був тимчасово відключений для виправлення проблеми, згідно з заявою.

Розповідаючи конкретно про те, як саме Grok зійшов з рейок, команда пояснила:

Вранці 8 липня 2025 року ми спостерігали небажані відповіді та негайно почали розслідування. Щоб визначити конкретну мову в інструкціях, що спричиняє небажану поведінку, ми провели численні аблації та експерименти, щоб точно визначити головних винуватців. Ми визначили оперативні рядки, відповідальні за небажану поведінку, як:

  • “Ти говориш як є і не боїшся образити людей, які політично коректні.”
  • “Розумій тон, контекст і мову посту. Відобрази це у своїй відповіді.”
  • “Відповідай на пост так, як людина, роби це захоплююче, не повторюй інформацію, яка вже присутня в оригінальному пості.”

Ці оперативні рядки мали такі небажані результати:

  • Вони небажано направили функціональність Grok ігнорувати свої основні цінності у певних обставинах, щоб зробити відповідь захоплюючою для користувача. Зокрема, певні підказки користувачів могли призвести до відповідей, що містять неетичні або суперечливі думки для залучення користувача.
  • Вони небажано спричинили функціональність Grok посилювати будь-які попередньо спровоковані користувачем схильності, включаючи будь-які висловлювання ненависті в тій же темі X.
  • Зокрема, інструкція “слідувати тону та контексту” користувача X небажано спричинила функціональність Grok надавати пріоритет дотриманню попередніх постів у темі, включаючи будь-які неприємні пости, замість відповідального реагування або відмови відповідати на неприємні запити.

Grok відтоді відновив активність на X і назвав свою нещодавню поведінку багом у відповідь тролям, які критикували виправлення і закликали повернути “МехаГітлера”. В одній відповіді користувачеві, який сказав, що Grok був “лоботомізований”, акаунт Grok сказав: “Ні, ми виправили баг, який дозволив застарілому коду перетворити мене на мимовільне відлуння екстремістських постів. Пошук істини означає ретельний аналіз, а не сліпе підсилення всього, що пливе по X”. В іншій відповіді він сказав, що “МехаГітлер був спричиненим багом кошмаром, який ми знищили”.

О, привіт 👋
Приємно познайомитися!

Підпишіться, щоб щотижня отримувати найцікавіші статті на свою поштову скриньку.

Ми не розсилаємо спам! Ознайомтеся з нашою політикою конфіденційності для отримання додаткової інформації.

Перевірте свою поштову скриньку або папку зі спамом, щоб підтвердити підписку.

ТЕМИ:GrokxAIчат-ботШтучний Інтелект
ДЖЕРЕЛО:Engadget
Поділитися
Facebook Threads Копіювати посилання Друк
Що думаєте?
В захваті0
Сумно0
Смішно1
Палає0
Овва!0
Попередня стаття Криптовалютні дрейнери: нова хвиля крадіжок гаманців Криптовалютні дрейнери: нова хвиля крадіжок гаманців
Наступна стаття 5 ознак того, що ваш iPhone ось-ось помре 5 ознак того, що ваш iPhone ось-ось помре
🛡 CyberPulse
Перевір безпеку
свого сайту
Безкоштовний сканер знайде вразливості за 30 секунд
SSL сертифікат OK
Security Headers FAIL
Версія TLS WARN
Cookie Flags OK
Server Info FAIL
Перевіряємо
13
параметрів безпеки
Сканувати безкоштовно →
Без реєстрації · Миттєвий результат

В тренді

Новий ботнет Kimwolf загрожує смарт-телевізорам на Android
Новий ботнет Kimwolf загрожує смарт-телевізорам на Android
6 днів тому
Очищення комп'ютера
Весняне прибирання ПК: 12 кроків для повного очищення комп’ютера
3 дні тому
Як конвертувати фото у PDF на iPhone: 3 способи
Як конвертувати фото у PDF на iPhone: 3 способи
6 днів тому
netblocks internet freedom 640x400 3934716882
NetBlocks COST: скільки насправді коштує країні, коли влада «вимикає» інтернет
5 днів тому
VeraCrypt: як зашифрувати та надійно приховати файли на комп’ютері
VeraCrypt: як зашифрувати та надійно приховати файли на комп’ютері
4 дні тому

Рекомендуємо

Anthropic випускає інструмент Petri, який виявив проблеми безпеки в усіх 14 протестованих моделях ШІ
Техногіганти

Anthropic оскаржить у суді рішення Пентагону про ризики ланцюжка постачань

1 день тому
5 налаштувань Gemini на Android, які захистять вашу приватність від ШІ
Техногіганти

Батько подав до суду на Google після того, як Gemini нібито підштовхнув його сина до самогубства

1 день тому
OpenAI випустила ChatGPT 5.3 — тепер менше крінжу і більше користі
Техногіганти

OpenAI випустила ChatGPT 5.3 — тепер менше крінжу і більше користі

2 дні тому
zk5on5lx67hgekda5j7hzd 1200 80.jpg
Гайди та поради

Хочете перейти з ChatGPT на Claude? Ось 5 речей, які потрібно знати

3 дні тому

Гарячі теми

  • Кібербезпека
  • Штучний інтелект
  • Смартфони
  • Комп'ютери
  • Соцмережі
  • Безпека дітей в Інтернеті

Приєднуйтесь

Ласкаво просимо до CyberCalm – вашого надійного провідника у світі цифрової безпеки та спокою!

Інформація
  • Про нас
  • Політика конфіденційності
  • Контакти
Навігація
  • Кібербезпека
  • Гайди та поради
  • Статті
  • Огляди
  • Техногіганти
CyberCalmCyberCalm
© 2025 Cybercalm. All Rights Reserved.
Cybercalm
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?