Nvidia, світовий лідер у виробництві чіпів для штучного інтелекту, зробила важливий крок до того, щоб стати не лише постачальником обладнання, а й серйозним розробником AI-моделей. Компанія представила серію моделей Nemotron 3, які розповсюджуються як open source рішення.
Чому Nvidia виходить на ринок ШІ-моделей
Цей крок може здатися несподіваним для компанії, яка заробила статки на постачанні чіпів іншим розробникам AI. Проте стратегія Nvidia щодо підтримки відкритого штучного інтелекту може бути зумовлена прагматичними міркуваннями: закриті моделі все частіше працюють на чіпах конкурентів компанії.
Вихід на ринок моделей може стати для Nvidia страховкою на випадок, якщо гіганти штучного інтелекту — OpenAI, Google та Anthropic з часом відмовляться від її технологій, створивши власні чипи.
Відкриті моделі вже є важливою частиною екосистеми ШІ — дослідники та стартапи використовують їх для експериментів, прототипування та розробки. OpenAI та Google пропонують невеликі відкриті моделі, проте оновлюють їх рідше, ніж китайські конкуренти. Саме тому відкриті моделі від китайських компаній наразі значно популярніші, про що свідчать дані платформи Hugging Face.
Характеристики Nemotron 3
Нові моделі Nemotron 3 від Nvidia входять до числа найкращих серед тих, які можна завантажити, модифікувати та запускати на власному обладнанні — принаймні згідно з результатами бенчмарків, оприлюдненими компанією.
«Відкриті інновації — це основа прогресу в галузі ШІ. З Nemotron ми перетворюємо передовий штучний інтелект на відкриту платформу, яка дає розробникам прозорість та ефективність для створення агентних систем у масштабі», — заявив генеральний директор Nvidia Дженсен Хуанг.
Моделі Nemotron 3 представлені в трьох розмірах:
- Nano — 30 мільярдів параметрів
- Super — 100 мільярдів параметрів
- Ultra — 500 мільярдів параметрів
Кількість параметрів моделі приблизно відповідає її можливостям, але водночас і складності запуску. Найбільші моделі настільки ресурсомісткі, що потребують стійок із дорогим обладнанням.
Читайте також: Як встановити LLM Ollama на MacOS (і чому ви повинні це зробити)
Прозорий підхід до розробки
Nvidia обрала більш прозорий підхід, ніж більшість американських конкурентів, опублікувавши дані, на яких навчались моделі Nemotron. Це має допомогти інженерам легше модифікувати моделі. Компанія також випустила інструменти для кастомізації та тонкого налаштування.
Серед нововведень — гібридна архітектура латентної суміші експертів (mixture-of-experts), яка, за словами Nvidia, особливо ефективна для створення ШІ-агентів, здатних виконувати дії на комп’ютерах чи в інтернеті. Крім того, компанія запустила бібліотеки для навчання агентів за допомогою навчання з підкріпленням (reinforcement learning).
Чому відкриті моделі важливі
Карі Енн Бріскі, віцепрезидентка Nvidia з програмного забезпечення генеративного ШІ для підприємств, пояснила важливість відкритих моделей трьома факторами:
- розробникам дедалі частіше потрібно адаптувати моделі під конкретні завдання;
- часто ефективніше передавати запити різним моделям;
- легше отримувати якісніші відповіді після навчання завдяки симульованому міркуванню.
«Ми віримо, що відкритий код — це основа інновацій у сфері ШІ, що продовжує прискорювати глобальну економіку», — зазначила Бріскі.
Тенденція до закритості
Перші передові відкриті моделі випустила Meta у лютому 2023 року під назвою Llama. Однак із загостренням конкуренції компанія дала зрозуміти, що майбутні релізи можуть не бути відкритими.
Це частина ширшої тенденції в індустрії ШІ: протягом останнього року американські компанії відходять від відкритості, стають більш закритими щодо своїх досліджень і менш охочими ділитися інженерними знахідками з конкурентами.
Що означає Nemotron 3 для індустрії
Серія моделей Nemotron 3 розширює портфоліо Nvidia у сфері програмного забезпечення для AI. Компанія вже має екосистему інструментів, включно з CUDA, cuDNN та іншими бібліотеками, які стали стандартом для розробників машинного навчання.
Випуск власних моделей дозволяє Nvidia краще демонструвати можливості своїх чіпів та надавати готові рішення для бізнесу. Це може бути особливо привабливо для компаній, які хочуть швидко впровадити AI, але не мають досвіду у навчанні власних моделей.
Водночас open source підхід означає, що ці моделі можна адаптувати, модифікувати та використовувати без обмежень, що сприяє інноваціям у галузі.
Конкуренція на ринку AI-моделей
Вихід Nvidia на ринок AI-моделей додає нового гравця до вже насиченої конкуренції. Компанія приєднується до Meta з її відкритими моделями Llama, Mistral AI, Stability AI та інших прихильників open source підходу.
Для індустрії це позитивний розвиток: більше відкритих моделей означає більше можливостей для дослідників, розробників та компаній експериментувати з AI без необхідності платити за API або розробляти все з нуля.
Проте питання залишається відкритим: чи зможе Nvidia, компанія з експертизою в апаратному забезпеченні, конкурувати з організаціями, які роками спеціалізуються на створенні мовних моделей та машинному навчанні?


