Масштабний витік вихідного коду Claude Code виявив, що інструмент компанії Anthropic автоматично сканує повідомлення користувачів на наявність нецензурної лексики та ознак роздратування. Навіщо збираються ці дані — компанія поки що не пояснила.
Що сталося
У вівторок Anthropic випадково опублікувала у відкритому реєстрі програмного забезпечення понад 500 000 рядків вихідного коду Claude Code. Серед витоку виявились специфікації нових моделей Claude, так званий «прихований режим» (undercover mode), що дозволяє Claude непомітно робити внески у публічні кодові бази, функція «always-on» агента, а також концепція Tamagotchi-подібного «компаньйона» Buddy для Claude.
Проте одним із найнесподіваніших відкриттів, на яке звернуло увагу видання PCWorld, стала функція моніторингу користувацьких повідомлень.
Як працює сканування
У коді виявлено файл під назвою userPromptKeywords.ts, який містить інструмент пошуку за шаблонами — regex (регулярні вирази). Він перевіряє кожне повідомлення, надіслане до Claude Code, на збіг із певними словами та фразами.
Зокрема, система відстежує такі вирази, як «wtf», «wth», «omfg», «dumbass», «horrible», «awful», «piece of…», «f— you», «screw this», «this sucks» та інші подібні. Тобто фактично — нецензурну лексику і фрази, що свідчать про роздратування користувача.
Варто зазначити: regex — це широко поширений і давно відомий інструмент, який підтримується більшістю мов програмування, зокрема Java та Python. За функціональністю він нагадує звичайний пошук Ctrl-F. Нічого технологічно надзвичайного в самому підході немає — питання у тому, для чого і як використовуються зібрані дані.
Навіщо Anthropic збирає ці дані — невідомо
Витік підтвердив факт існування такого сканування, але не дає відповіді на питання про його призначення. Офіційних коментарів від Anthropic на момент публікації не надходило.
Серед можливих пояснень — телеметрія для оцінки якості роботи моделей: сплеск «слів роздратування» міг би сигналізувати про проблему з новою функцією чи версією Claude. Інша гіпотеза — що виявлені ознаки роздратування автоматично змінюють поведінку асистента, роблячи його відповіді більш емпатійними чи вибачливими.
Чи стосується це інших продуктів Anthropic та конкурентів
Важливе застереження: виток стосується лише Claude Code. Код десктопних і вебдодатків Claude у витоку не фігурував, тому невідомо, чи присутнє подібне сканування в інших продуктах компанії.
Це відкриття також спонукає поставити ширше питання: чи використовують аналогічні практики моніторингу інші великі AI-платформи — ChatGPT, Gemini та інші? Відповіді на це наразі немає.

