Минулого тижня китайський стартап DeepSeek підняв хвилю, випустивши повну версію R1 – моделі міркувань з відкритим вихідним кодом, яка може перевершити o1 від OpenAI.
У понеділок в App Store кількість завантажень ШІ-асистента DeepSeek обійшла ChatGPT, який до цього був найбільш завантажуваним безкоштовним додатком. DeepSeek також вже піднявся на третє місце в загальному заліку чат-ботів HuggingFace’s Chatbot Arena, випередивши кілька моделей Gemini та ChatGPT-4o.
Але майже одразу після того, як він скинув з трону OpenAI, DeepSeek почав обмежувати реєстрацію через кібератаку. Наразі сторінка реєстрації DeepSeek містить повідомлення про обмеження.
Що таке DeepSeek?
Заснований Лян Веньфенгом у травні 2023 року (а отже, йому не виповнилося й двох років), китайський стартап кинув виклик усталеним AI-компаніям своїм підходом з відкритим вихідним кодом. На думку Forbes, перевага DeepSeek може полягати в тому, що вона фінансується лише хедж-фондом High-Flyer, яким також керує Веньфенг, що дає компанії модель фінансування, яка підтримує швидке зростання та дослідження.
Що таке DeepSeek R1?
Повністю випущена минулого тижня, R1 є флагманською моделлю міркувань DeepSeek, яка працює на рівні або вище хваленої моделі o1 від OpenAI в декількох тестах з математики, кодування та міркувань. Найцікавішим у R1 є те, що, на відміну від інших топ-моделей від технологічних гігантів, вона має відкритий вихідний код, тобто будь-хто може завантажити і використовувати її.
Крім того, навчання на цій моделі коштує значно менше, ніж на інших аналогічних моделях, а отже, доступ до неї дешевший. Для порівняння, доступ до API R1 починається з $0,14 за мільйон токенів, що становить лише дрібну частину від $7,50, які OpenAI стягує за еквівалентний рівень.
У дослідницькій роботі DeepSeek стверджує, що навчання її моделі V3 коштувало 5,6 мільйона доларів, і ця цифра циркулює (і оскаржується) як повна вартість розробки моделі. Як повідомляє AP, деякі експерти лабораторій вважають, що в документі йдеться лише про остаточний тренувальний запуск для V3, а не про всю вартість його розробки (яка становитиме невелику частину того, що технологічні гіганти витратили на створення конкурентоспроможних моделей). Деякі припускають, що витрати DeepSeek не включають більш ранні витрати на інфраструктуру, дослідження та розробки, дані та персонал.
Одним з недоліків, який може вплинути на довгострокову конкуренцію з o1 та іншими американськими моделями, є цензура. Китайські моделі часто включають блоки на певну тематику, що означає, що хоча вони функціонують порівняно з іншими моделями, вони можуть не відповідати на деякі запити (дивіться, як AI-помічник DeepSeek відповідає на запити про площу Тяньаньмень і Тайвань тут).
У грудні Тірнан Рей з ZDNET порівняв здатність R1-Lite пояснювати свій ланцюжок думок зі здатністю o1, і результати виявилися неоднозначними.
Звичайно, всі популярні моделі мають власну історію створення, правила спільноти та обмеження щодо контенту – але принаймні на цьому етапі чат-боти американського виробництва навряд чи утримуватимуться від відповідей на запитання про історичні події.
Занепокоєння щодо конфіденційності
Занепокоєння щодо конфіденційності даних, які виникли навколо TikTok – китайського додатку для соціальних мереж, який зараз частково заборонений у США, – з’являються і щодо DeepSeek. Незрозуміло, які дані користувачів DeepSeek може збирати або потенційно передавати китайському уряду (згідно із заявами уряду США, які власник TikTok, компанія ByteDance, неодноразово заперечувала).
«Особиста інформація, яку ми збираємо від вас, може зберігатися на сервері, розташованому за межами країни, де ви проживаєте, – йдеться в політиці конфіденційності DeepSeek. «Ми зберігаємо зібрану нами інформацію на захищених серверах, розташованих у Китайській Народній Республіці».
У політиці зазначено, що DeepSeek збирає велику кількість інформації, включаючи, але не обмежуючись наступним:
- «IP-адреса, унікальні ідентифікатори пристрою та файли cookie»;
- «дата народження (де це можливо), ім’я користувача, адреса електронної пошти та/або номер телефону та пароль»;
- «ваше текстове або аудіо введення, підказки, завантажені файли, відгуки, історія чату або інший контент, який ви надаєте нашій моделі та Сервісам»;
- «підтвердження особи або віку, відгуки або запити про використання вами Сервісу», якщо ви зв’язуєтеся з DeepSeek.
Також в Політиці зазначається: «Якщо ми передаємо будь-яку особисту інформацію за межі країни, де ви проживаєте, в тому числі для однієї або декількох цілей, викладених у цій Політиці, ми будемо робити це відповідно до вимог чинного законодавства про захист даних». У ньому не згадується про дотримання GDPR.
«Користувачі повинні знати, що будь-які дані, що передаються платформі, можуть підлягати доступу уряду відповідно до законів Китаю про кібербезпеку, які вимагають, щоб компанії надавали доступ до даних за запитом влади», – сказав Адріанус Варменховен, член консультативної ради з безпеки NordVPN, електронною поштою.
«Модель штучного інтелекту DeepSeek зіткнулася зі зростаючою негативною реакцією за відмову торкатися політичних тем», — додав він. «Це викликало занепокоєння щодо потенційних упереджень та зовнішнього впливу на політику модерації контенту платформи».
На думку деяких спостерігачів, той факт, що R1 має відкритий вихідний код, означає підвищену прозорість, надаючи користувачам можливість перевірити вихідний код моделі на наявність ознак діяльності, пов’язаної з порушенням конфіденційності. Незважаючи на це, DeepSeek також випустила менші версії R1, які можна завантажити і запустити локально, щоб уникнути будь-яких побоювань щодо надсилання даних назад до компанії (на відміну від доступу до чат-бота в Інтернеті). Усі чат-боти, включно з ChatGPT, збирають певну кількість даних про користувачів, коли їх запитують через браузер.
Що це означає для штучного інтелекту в цілому
Успіх R1 підкреслює кардинальні зміни в ШІ, які можуть дати можливість невеликим лабораторіям і дослідникам створювати конкурентоспроможні моделі та урізноманітнити сферу доступних варіантів. Наприклад, організації, які не мають фінансування або персоналу OpenAI, можуть завантажити R1 і доопрацювати його, щоб конкурувати з такими моделями, як o1. Незадовго до виходу R1 дослідники з Каліфорнійського університету в Берклі створили модель з відкритим вихідним кодом, яка не поступається o1-preview, ранній версії o1, всього за 19 годин і приблизно за 450 доларів.
З огляду на те, наскільки непомірними стали інвестиції в ШІ, багато хто припускає, що ця розробка може лопнути бульбашку ШІ. Численні звіти вказують на те, що фондовий ринок вже панікує.
Зростання DeepSeek припадає на критичний момент для китайсько-американських технологічних відносин, всього через кілька днів після часткової заборони TikTok, за яку так довго боролися. За іронією долі, DeepSeek простою мовою викладає підґрунтя для занепокоєння з приводу безпеки, яке США намагалися довести щодо TikTok під час тривалої боротьби за його заборону.