Claude Code стежить за лайками користувачів: що відомо про витік коду Anthropic

Масштабний витік вихідного коду Claude Code виявив, що інструмент компанії Anthropic автоматично сканує повідомлення користувачів на наявність нецензурної лексики та ознак роздратування. Навіщо збираються ці дані — компанія поки що не пояснила.

Зміст

Що сталося
Як працює сканування
Навіщо Anthropic збирає ці дані — невідомо
Чи стосується це інших продуктів Anthropic та конкурентів

Що сталося

У вівторок Anthropic випадково опублікувала у відкритому реєстрі програмного забезпечення понад 500 000 рядків вихідного коду Claude Code. Серед витоку виявились специфікації нових моделей Claude, так званий «прихований режим» (undercover mode), що дозволяє Claude непомітно робити внески у публічні кодові бази, функція «always-on» агента, а також концепція Tamagotchi-подібного «компаньйона» Buddy для Claude.

Проте одним із найнесподіваніших відкриттів, на яке звернуло увагу видання PCWorld, стала функція моніторингу користувацьких повідомлень.

Як працює сканування

У коді виявлено файл під назвою userPromptKeywords.ts, який містить інструмент пошуку за шаблонами — regex (регулярні вирази). Він перевіряє кожне повідомлення, надіслане до Claude Code, на збіг із певними словами та фразами.

- Advertisement -

Зокрема, система відстежує такі вирази, як «wtf», «wth», «omfg», «dumbass», «horrible», «awful», «piece of…», «f— you», «screw this», «this sucks» та інші подібні. Тобто фактично — нецензурну лексику і фрази, що свідчать про роздратування користувача.

Варто зазначити: regex — це широко поширений і давно відомий інструмент, який підтримується більшістю мов програмування, зокрема Java та Python. За функціональністю він нагадує звичайний пошук Ctrl-F. Нічого технологічно надзвичайного в самому підході немає — питання у тому, для чого і як використовуються зібрані дані.

Навіщо Anthropic збирає ці дані — невідомо

Витік підтвердив факт існування такого сканування, але не дає відповіді на питання про його призначення. Офіційних коментарів від Anthropic на момент публікації не надходило.

Серед можливих пояснень — телеметрія для оцінки якості роботи моделей: сплеск «слів роздратування» міг би сигналізувати про проблему з новою функцією чи версією Claude. Інша гіпотеза — що виявлені ознаки роздратування автоматично змінюють поведінку асистента, роблячи його відповіді більш емпатійними чи вибачливими.

Чи стосується це інших продуктів Anthropic та конкурентів

Важливе застереження: виток стосується лише Claude Code. Код десктопних і вебдодатків Claude у витоку не фігурував, тому невідомо, чи присутнє подібне сканування в інших продуктах компанії.

Це відкриття також спонукає поставити ширше питання: чи використовують аналогічні практики моніторингу інші великі AI-платформи — ChatGPT, Gemini та інші? Відповіді на це наразі немає.

Соцмережі

Спеціальні теми

Інше

Claude Code відстежує роздратування користувачів: що відомо про витік коду Anthropic

Що сталося

Як працює сканування

Навіщо Anthropic збирає ці дані — невідомо

Чи стосується це інших продуктів Anthropic та конкурентів

О, привіт
Приємно познайомитися!

В тренді

NoVoice: шкідливе ПЗ у Android-додатках заразило 2,3 мільйона пристроїв

Infinity Stealer: нове шкідливе ПЗ для macOS ховається за фальшивою CAPTCHA від Cloudflare

Дослідження: ШІ-чатботи в любовних порадах підтримують користувача навіть тоді, коли він неправий

Як штучний інтелект підробляє результати соціологічних опитувань — і чому це небезпечно

Apple надсилає екстрені сповіщення на iPhone через активні атаки на старі версії iOS

Гарячі теми

Приєднуйтесь

Інформація

Навігація

Соцмережі

Спеціальні теми

Інше

Що сталося

Як працює сканування

Навіщо Anthropic збирає ці дані — невідомо

Чи стосується це інших продуктів Anthropic та конкурентів

О, привіт Приємно познайомитися!

В тренді

Рекомендуємо

Гарячі теми

Приєднуйтесь

Інформація

Навігація

О, привіт
Приємно познайомитися!