Переглядаючи цей сайт, ви погоджуєтесь з нашою політикою конфіденційності
Прийняти
  • Про нас
  • Політика конфіденційності
  • Контакти
CyberCalm
  • Кібербезпека
    КібербезпекаПоказати ще
    Ці розширення для Chrome виглядають легально, але шпигують за користувачами
    Критична вразливість Chrome дозволяє шкідливим розширенням шпигувати за користувачами через Gemini
    1 день тому
    Чому шахраї телефонують і мовчать — і як реагувати безпечно
    Чому шахраї телефонують і мовчать — і як реагувати безпечно
    2 дні тому
    Новий ботнет Kimwolf загрожує смарт-телевізорам на Android
    Новий ботнет Kimwolf загрожує смарт-телевізорам на Android
    3 дні тому
    Трояни: що це таке, якими бувають та як від них захиститися
    Трояни: що це таке, якими бувають та як від них захиститися
    4 дні тому
    GetContact: чому цей додаток небезпечний для українців і як видалити свій номер з бази
    Чому GetContact небезпечний для українців і як видалити свій номер з бази
    5 днів тому
  • Гайди та поради
    Гайди та поради
    Корисні поради, які допоможуть вам почуватися безпечно в мережі, а також маленькі хитрощі у користуванні вашими гаджетами.
    Показати ще
    Топ-новини
    Як перенести Telegram на інший телефон
    Як перенести Telegram на інший телефон. ІНСТРУКЦІЯ
    10 місяців тому
    Перше налаштування ноутбука: 8 речей, які слід зробити після придбання ноутбука з Windows
    Перше налаштування ноутбука: 8 речей, які слід зробити після придбання ноутбука з Windows
    5 місяців тому
    digital card
    Як перетворити свій профіль в Instagram на цифрову візитівку
    11 місяців тому
    Останні новини
    Весняне прибирання ПК: 12 кроків для повного очищення комп’ютера
    2 години тому
    VeraCrypt: як зашифрувати та надійно приховати файли на комп’ютері
    1 день тому
    Як конвертувати фото у PDF на iPhone: 3 способи
    5 днів тому
    Як надсилати фото з iPhone без втрати якості: усі робочі способи
    5 днів тому
  • Статті
    Статті
    Цікаві статті про світ технологій, інтернет та кіберзахист. Розбираємо складні теми, від штучного інтелекту до безпеки даних та Big Data. Аналітика для допитливих та професіоналів.
    Показати ще
    Топ-новини
    Для яких завдань потрібен VDS сервер: реальні приклади та особистий досвід
    Для яких завдань потрібен VDS сервер: реальні приклади та особистий досвід
    3 місяці тому
    Які послуги входять в обслуговування орендованого сервера
    Які послуги входять в обслуговування орендованого сервера
    3 місяці тому
    Топ-10 невдач Microsoft
    Топ-10 невдач Microsoft
    4 місяці тому
    Останні новини
    Когнітивна війна: головна загроза XXI століття
    1 день тому
    NetBlocks COST: скільки насправді коштує країні, коли влада «вимикає» інтернет
    2 дні тому
    Новий загальноєвропейський проєкт QARC забезпечить квантову стійкість для майбутньої безпеки даних
    6 днів тому
    Чому Telegram-канали небезпечні як джерело новин і як повернути контроль над інформацією
    1 тиждень тому
  • Огляди
    ОглядиПоказати ще
    Nearby Glasses: Android-застосунок для виявлення смарт-окулярів поблизу
    Nearby Glasses: Android-застосунок для виявлення смарт-окулярів поблизу
    7 днів тому
    FreeOffice — безкоштовна альтернатива Microsoft Office для Windows, macOS, Linux та мобільних пристроїв
    FreeOffice — безкоштовна альтернатива Microsoft Office для Windows, macOS, Linux та мобільних пристроїв
    1 тиждень тому
    Kali Linux проти Parrot OS: який дистрибутив краще для кібербезпеки?
    Kali Linux проти Parrot OS: який дистрибутив краще для кібербезпеки?
    4 тижні тому
    Гнучкі смартфони: еволюція чи дорогий експеримент? Огляд провідних моделей
    Гнучкі смартфони: еволюція чи дорогий експеримент? Огляд провідних моделей
    1 місяць тому
    Titan Security Key: як працює апаратний ключ безпеки від Google
    Titan Security Key: як працює апаратний ключ безпеки від Google
    1 місяць тому
  • Техногіганти
    • Google
    • Apple
    • Microsoft
    • Meta
    • OpenAI
    • Anthropic
    • xAI
    • Samsung
  • Теми
    • Комп’ютери
    • Смартфони
    • Електронна пошта
    • Windows
    • Linux
    • Android
    • iPhone
    • VPN
    • Штучний інтелект
    • Робототехніка
  • Сканер безпеки сайту
Соцмережі
  • Facebook
  • Instagram
  • YouTube
  • TikTok
  • X (Twitter)
  • Threads
Спеціальні теми
  • Кібервійна
  • Маніпуляції в медіа
  • Безпека дітей в Інтернеті
  • Розумний будинок
Інше
  • Архів
Читання: DeepSeek V3.2: чи загрожує новий відкритий ШІ домінуванню пропрієтарних моделей
Розмір шрифтаAa
CyberCalmCyberCalm
Пошук
  • Техногіганти
    • Комп’ютери
    • Смартфони
    • Соцмережі
    • Google
    • Android
    • Apple
    • Windows
    • Linux
    • Штучний інтелект
    • Безпека дітей в інтернеті
  • Кібербезпека
  • Гайди та поради
  • Статті
  • Огляди
  • Архів
  • Сканер безпеки сайту
Follow US
  • Про проєкт Cybercalm
  • Політика конфіденційності
  • Контакти
© 2025 Cybercalm. All Rights Reserved.
Головна / Огляди / DeepSeek V3.2: чи загрожує новий відкритий ШІ домінуванню пропрієтарних моделей

DeepSeek V3.2: чи загрожує новий відкритий ШІ домінуванню пропрієтарних моделей

Китайська компанія DeepSeek знову привернула увагу технологічної спільноти, випустивши V3.2 — нову ітерацію у своїй серії моделей V3.

Огляди
3 місяці тому
Поширити
7 хв. читання
DeepSeek V3.2: чи загрожує новий відкритий ШІ домінуванню пропрієтарних моделей

Завдяки вражаючим еталонним результатам останній випуск китайської лабораторії штучного інтелекту з відкритим вихідним кодом знову розпалює питання про те, чи варті дорогі моделі своєї ціни.

Зміст
  • Можливості нової моделі
  • Діагностика проблем відкритих моделей
  • Технологічне рішення: розріджена увага
  • Обмеження та перспективи

Модель, представлена в понеділок, базується на експериментальній версії V3.2, анонсованій у жовтні. Вона доступна у двох варіантах: «Thinking» та потужніша «Speciale». За заявою DeepSeek, V3.2 розширює можливості штучного інтелекту з відкритим кодом. Як і попередні моделі компанії, вона коштує значно дешевше за пропрієтарні аналоги, а базові ваги доступні через платформу Hugging Face.

DeepSeek вперше опинилася в центрі уваги у січні, випустивши R1 — модель з відкритим кодом для логічних міркувань, яка перевершила OpenAI o1 за кількома ключовими бенчмарками. Враховуючи, що продуктивність V3.2 також конкурує з потужними пропрієтарними моделями, це може знову змінити розклад сил в індустрії ШІ.

Можливості нової моделі

Чутки про те, що DeepSeek планує запустити власного економічно ефективного агента для конкуренції з OpenAI та Google, почали циркулювати ще у вересні. Тепер цей конкурент нарешті з’явився.

- Advertisement -

V3.2 є найновішою ітерацією V3 — моделі, випущеної майже рік тому, яка також стала основою для R1. Згідно з опублікованими компанією даними, V3.2 Speciale перевершує провідні пропрієтарні моделі — зокрема GPT-5 High від OpenAI, Claude 4.5 Sonnet від Anthropic та Gemini 3.0 Pro від Google — за деякими бенчмарками логічного мислення. Варто зазначити, що Kimi K2, безкоштовна модель з відкритим кодом від Moonshot, також заявляла про конкурентну продуктивність порівняно з GPT-5 та Sonnet 4.5.

Щодо вартості: доступ до Gemini 3 через API коштує до 4 доларів за 1 мільйон токенів, тоді як V3.2 Speciale — лише 0,028 долара за 1 мільйон токенів. За даними компанії, нова модель також досягла «золотого» рівня продуктивності на Міжнародній математичній олімпіаді (IMO) та Міжнародній олімпіаді з інформатики.

«DeepSeek-V3.2 постає як високоефективна альтернатива для агентних сценаріїв, суттєво скорочуючи розрив у продуктивності між відкритими та передовими пропрієтарними моделями при значно нижчих витратах», — зазначили дослідники компанії у науковій публікації.

Хоча ці заяви все ще обговорюються, вони продовжують тенденцію DeepSeek до зниження витрат з кожним новим релізом, що ставить під сумнів доцільність величезних інвестицій, які пропрієтарні лабораторії на кшталт OpenAI вкладають у свої моделі.

Діагностика проблем відкритих моделей

DeepSeek заявила, що створила V3.2 з метою допомогти спільноті відкритого ШІ наздогнати деякі технічні досягнення компаній, що розробляють закриті моделі. За даними компанії, агентні та логічні можливості провідних пропрієтарних моделей «прискорювалися значно швидше», ніж у їхніх відкритих аналогів.

Як казав інженер Чарльз Кеттерінг: «Правильно сформульована проблема — це наполовину вирішена проблема». Саме тому DeepSeek розпочала розробку нової моделі зі спроби діагностувати причини відставання open-source моделей, виокремивши три ключові фактори.

По-перше, моделі з відкритим кодом традиційно покладалися на так звану «vanilla attention» — повільний та енергозатратний механізм обробки вхідних даних і генерації виходів, через що вони погано справлялися з довгими послідовностями токенів. По-друге, вони мали обмеженішу обчислювальну фазу пост-тренування, що погіршувало їхню здатність виконувати складні завдання. По-третє, на відміну від пропрієтарних моделей, вони погано слідували довгим інструкціям та узагальнювали між завданнями, що робило їх неефективними агентами.

Технологічне рішення: розріджена увага

У відповідь компанія представила DeepSeek Sparse Attention (DSA) — механізм, який «пом’якшує критичну обчислювальну складність без втрати продуктивності на довгих контекстах».

При традиційному підході vanilla attention модель генерує виходи, порівнюючи кожен окремий токен із запиту з кожним токеном у навчальних даних — надзвичайно енергозатратний процес. Для ілюстрації: уявіть, що вам потрібно перекопати величезну купу книжок, розкиданих на газоні, щоб знайти конкретне речення. Це можливо, але потребує багато часу та ретельного перегляду величезної кількості сторінок.

- Advertisement -

Підхід DSA працює розумніше. Він застосовується у дві фази: спочатку «блискавичний індексатор» виконує високорівневе сканування токенів у навчальних даних, щоб виявити невелику підмножину, найбільш релевантну до конкретного запиту. Потім модель застосовує повну обчислювальну потужність саме до цієї підмножини. Замість копирсання у гігантській купі книжок ви заходите до охайно організованої бібліотеки, прямуєте до потрібного розділу і виконуєте значно менш виснажливий пошук потрібного уривку.

Для вирішення проблеми пост-тренування компанія створила «спеціалізовані» моделі для тестування та вдосконалення здібностей V3.2 у сферах написання текстів, загальних запитань, математики, програмування, логічних міркувань, агентних завдань, агентного кодування та агентного пошуку. Вони функціонують як репетитори, покликані перетворити модель-універсала на мультиспеціаліста.

Обмеження та перспективи

За даними дослідницької публікації, DeepSeek V3.2 «ефективно долає розрив між обчислювальною ефективністю та передовими можливостями логічного мислення» і «відкриває нові можливості для надійних та універсальних ШІ-агентів» через відкритий код.

Втім, є кілька застережень. «Знання про світ» нової моделі — широта практичного розуміння реального світу, яку можна вивести з корпусу навчальних даних — значно обмеженіша порівняно з провідними пропрієтарними моделями. Модель також потребує більше токенів для генерації виходів, порівнянних за якістю з передовими пропрієтарними моделями, та погано справляється зі складнішими завданнями. DeepSeek планує продовжувати скорочувати розрив між своїми моделями з відкритим кодом та пропрієтарними аналогами шляхом масштабування обчислень під час попереднього навчання та вдосконалення «рецепту пост-тренування».

Попри ці обмеження, сам факт того, що компанія — до того ж китайська — створила модель з відкритим кодом, здатну конкурувати з можливостями логічного мислення найпередовіших пропрієтарних моделей на ринку, є значною подією. Це підтверджує зростаючі докази того, що «розрив у продуктивності» між відкритими та закритими моделями не є фіксованим і невирішуваним фактом, а технічною розбіжністю, яку можна подолати через креативні підходи до попереднього навчання, механізмів уваги та пост-тренування.

Ще важливіше те, що майже безкоштовний доступ розробників до базових ваг моделі може підірвати основну торгову пропозицію провідних розробників закритих моделей: що платити за доступ до цих інструментів варто, оскільки вони найкращі на ринку. Якщо моделі з відкритим кодом затьмарять пропрієтарні, більшості користувачів не буде сенсу продовжувати платити за останні.

О, привіт 👋
Приємно познайомитися!

Підпишіться, щоб щотижня отримувати найцікавіші статті на свою поштову скриньку.

Ми не розсилаємо спам! Ознайомтеся з нашою політикою конфіденційності для отримання додаткової інформації.

Перевірте свою поштову скриньку або папку зі спамом, щоб підтвердити підписку.

ТЕМИ:DeepSeekOpen SourceШтучний Інтелект
ДЖЕРЕЛО:ZDNET
Поділитися
Facebook Threads Копіювати посилання Друк
Що думаєте?
В захваті0
Сумно0
Смішно0
Палає0
Овва!0
Попередня стаття Рейтинг приватності ШІ-сервісів: хто захищає ваші дані, а хто — ні Прихована загроза ШІ-агентів: як уникнути катастрофи при впровадженні ШІ
Наступна стаття Steam вимагає розкривати використання ШІ в іграх — CEO Epic вважає це безглуздям Steam вимагає розкривати використання ШІ в іграх — CEO Epic вважає це безглуздям
🛡 CyberPulse
Перевір безпеку
свого сайту
Безкоштовний сканер знайде вразливості за 30 секунд
SSL сертифікат OK
Security Headers FAIL
Версія TLS WARN
Cookie Flags OK
Server Info FAIL
Перевіряємо
13
параметрів безпеки
Сканувати безкоштовно →
Без реєстрації · Миттєвий результат

В тренді

Новий ботнет Kimwolf загрожує смарт-телевізорам на Android
Новий ботнет Kimwolf загрожує смарт-телевізорам на Android
3 дні тому
Очищення комп'ютера
Весняне прибирання ПК: 12 кроків для повного очищення комп’ютера
2 години тому
Як конвертувати фото у PDF на iPhone: 3 способи
Як конвертувати фото у PDF на iPhone: 3 способи
3 дні тому
Як надсилати фото з iPhone без втрати якості: усі робочі способи
Як надсилати фото з iPhone без втрати якості: усі робочі способи
5 днів тому
netblocks internet freedom 640x400 3934716882
NetBlocks COST: скільки насправді коштує країні, коли влада «вимикає» інтернет
2 дні тому

Рекомендуємо

Anthropic відкрила пам'ять Claude для безкоштовних користувачів
Техногіганти

Anthropic відкрила пам’ять Claude для безкоштовних користувачів

24 години тому
Lenovo представила концепти настільних AI-асистентів — у тому числі роботизовану руку з «очима цуценяти»
Техногіганти

Lenovo представила концепти настільних AI-асистентів — у тому числі роботизовану руку з «очима цуценяти»

2 дні тому
OpenAI тестує інструмент клонування голосу з 15-секундного аудіо
Техногіганти

OpenAI розкрила деталі угоди з Пентагоном

2 дні тому
Anthropic відмовилась виконувати вимоги Пентагону попри погрози Хеґсета
Техногіганти

Anthropic відмовилась виконувати вимоги Пентагону попри погрози Хеґсета

5 днів тому

Гарячі теми

  • Кібербезпека
  • Штучний інтелект
  • Смартфони
  • Комп'ютери
  • Соцмережі
  • Безпека дітей в Інтернеті

Приєднуйтесь

Ласкаво просимо до CyberCalm – вашого надійного провідника у світі цифрової безпеки та спокою!

Інформація
  • Про нас
  • Політика конфіденційності
  • Контакти
Навігація
  • Кібербезпека
  • Гайди та поради
  • Статті
  • Огляди
  • Техногіганти
CyberCalmCyberCalm
© 2025 Cybercalm. All Rights Reserved.
Cybercalm
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?