Google щойно випустив свою найпотужнішу модель штучного інтелекту, але на що вона здатна?
Що таке Google Gemini?
Gemini – це нова потужна модель штучного інтелекту від Google, яка може розуміти не лише текст, але й зображення, відео та аудіо. Як мультимодальна модель, Gemini здатна виконувати складні завдання з математики, фізики та інших галузей, а також розуміти та генерувати високоякісний код на різних мовах програмування.
Наразі вона доступна завдяки інтеграції з Google Bard та Google Pixel 8 і поступово буде інтегрована в інші сервіси Google.
“Gemini – це результат масштабних спільних зусиль команд з усього Google, включаючи наших колег з Google Research, – каже Денніс Хассабіс, генеральний директор і співзасновник Google DeepMind. “Він був побудований з нуля, щоб бути мультимодальним, а це означає, що він може узагальнювати і безперешкодно розуміти, оперувати і поєднувати різні типи інформації, включаючи текст, код, аудіо, зображення і відео”.
Хто створив Gemini?
Gemini був створений Google і Alphabet, материнською компанією Google, і випущений як найдосконаліша модель ШІ компанії на сьогоднішній день. Google DeepMind також зробив значний внесок у розробку Gemini.
Чи існують різні версії Gemini?
Google описує Gemini як гнучку модель, яка здатна працювати на всьому: від дата-центрів Google до мобільних пристроїв. Щоб досягти такої масштабованості, Gemini випускається в трьох розмірах: Gemini Nano, Gemini Pro та Gemini Ultra.
- Gemini Nano: Модель Gemini Nano призначена для роботи на смартфонах, зокрема на Google Pixel 8. Він створений для виконання на пристрої завдань, які потребують ефективної обробки ШІ без підключення до зовнішніх серверів, наприклад, підказування відповідей у чатах або узагальнення тексту.
- Gemini Pro: Gemini Pro, що працює в дата-центрах Google, призначений для роботи з останньою версією чат-бота Bard. Він здатний швидко реагувати та розуміти складні запити.
- Gemini Ultra: Хоча Gemini Ultra ще не доступний для широкого використання, Google описує його як найпотужнішу модель, яка перевершує “сучасні результати за 30 з 32 широко використовуваних академічних тестів, що застосовуються в дослідженнях і розробках великих мовних моделей (LLM)”. Він призначений для дуже складних завдань і буде випущений після завершення поточної фази тестування.
Як отримати доступ до Gemini?
Зараз Gemini доступний на продуктах Google у версіях Nano та Pro, таких як телефон Pixel 8 та чат-бот Bard, відповідно. Згодом Google планує інтегрувати Gemini у свій Пошук, Оголошення, Chrome та інші сервіси.
Розробники та корпоративні клієнти зможуть отримати доступ до Gemini Pro через Gemini API в Google AI Studio та Google Cloud Vertex AI, починаючи з 13 грудня. Розробники Android отримають доступ до Gemini Nano через AICore, який буде доступний на основі раннього попереднього перегляду.
Чим Gemini відрізняється від інших моделей ШІ, таких як GPT-4?
Нова модель Gemini від Google є однією з найбільших і найдосконаліших моделей штучного інтелекту на сьогоднішній день, хоча остаточно це можна буде визначити лише після виходу моделі Ultra. Порівняно з іншими популярними моделями, на яких зараз працюють чат-боти зі штучним інтелектом, Gemini виділяється своєю вродженою мультимодальністю, тоді як інші моделі, як-от GPT-4, покладаються на плагіни та інтеграції, щоб бути по-справжньому мультимодальними.
Джерело: ZDNET