Claude Sonnet 4.5 — найбезпечніша модель штучного інтелекту Anthropic

У травні Anthropic анонсувала дві нові системи ШІ — Opus 4 та Sonnet 4. Тепер, менш ніж за півроку, компанія представляє Sonnet 4.5 і називає її найкращою моделлю для програмування у світі на сьогодні. Anthropic обґрунтовує цю заяву результатами тестів, у яких новий ШІ перевершує не лише попередника, а й дорожчу модель Opus 4.1 та конкуруючі системи, зокрема Gemini 2.5 Pro від Google та GPT-5 від OpenAI.

Наприклад, у тесті OSWorld, який перевіряє моделі ШІ на реальних комп’ютерних завданнях, Sonnet 4.5 встановила рекордний результат 61,4%, випередивши Opus 4.1 на 17%.

Водночас нова модель здатна автономно працювати над багатоетапними проєктами понад 30 годин — значне покращення порівняно з приблизно сімома годинами роботи Opus 4 на момент запуску. Це важливий крок для створення агентних систем, які прагне розробляти Anthropic.

sonnet benchmarks — Sonnet 4.5 перевершує старіші моделі Anthropic у програмуванні та агентних завданнях. (Anthropic)

Можливо, ще важливіше те, що компанія стверджує: Sonnet 4.5 — її найбезпечніша система ШІ на сьогодні. Модель пройшла «ретельне» навчання з безпеки, завдяки чому чат-бот, за словами Anthropic, «значно» менш схильний до «підлабузництва, обману, прагнення до влади та схильності заохочувати маячне мислення» — усіх потенційних особливостей моделі, які останніми місяцями створили проблеми для OpenAI. Крім того, Anthropic посилила захист Sonnet 4.5 від атак через ін’єкції промптів. Через складність нової моделі Anthropic випускає Sonnet 4.5 у рамках структури безпеки AI Safety Level 3, що означає наявність фільтрів для запобігання потенційно небезпечним відповідям на запити про хімічну, біологічну та ядерну зброю.

- Advertisement -

sonnet 4 5 behavior — Діаграма, яка показує порівняння Sonnet 4.5 з іншими передовими моделями у тестах на безпеку. (Anthropic)

Разом із сьогоднішнім оголошенням Anthropic також запроваджує покращення зручності користування в усій лінійці продуктів Claude. По-перше, Claude Code — популярний агент компанії для програмування — отримав оновлений інтерфейс терміналу з новою функцією під назвою «контрольні точки». Як можна здогадатися з назви, вони дозволяють зберігати прогрес і повертатися до попереднього стану, якщо Claude напише код, який працює не так, як ви очікували. Створення файлів, яке Anthropic почала впроваджувати на початку місяця, тепер доступне всім користувачам Pro. А якщо ви приєдналися до списку очікування Claude для Chrome, можете почати користуватися розширенням уже сьогодні.

Ціни API для Sonnet 4.5 залишаються на рівні $3 за мільйон вхідних токенів і $15 за таку саму кількість вихідних токенів. Випуск Sonnet 4.5 завершує успішний вересень для Anthropic. Лише через день після того, як Microsoft минулого тижня додала моделі Claude до Copilot 365, OpenAI визнала, що її конкурент пропонує найкращий ШІ для робочих завдань.