У четвер компанія випустила попередню версію Gemini 2.5 Flash, доступну через Gemini API, AI Studio та Vertex AI. Модель оперує знаннями, актуальними до січня 2025 року. Вона здатна обробляти текстові, візуальні, відео- та аудіозапити й має контекстне вікно обсягом в один мільйон токенів.
За словами Google, нова версія є розвитком Flash 2.0 і пропонує покращені можливості міркування, зберігаючи при цьому “відому швидкість та економічність”. Моделі з функцією міркування витрачають більше часу на “обмірковування” або інтерпретацію запиту перед наданням відповіді. Це забезпечує більш ретельний та точний результат, який краще відповідає потребам користувача, на відміну від попередніх моделей, орієнтованих на швидкість. Такі моделі також ефективніше справляються з багатоетапними завданнями.
“Gemini 2.5 Flash демонструє високі результати на складних запитах (Hard Prompts) у ChatBot Arena, поступаючись лише 2.5 Pro“, — зазначає Google у своєму анонсі.
Називаючи нову модель “найрентабельнішою”, Google підкреслює, що 2.5 Flash “дозволяє розробникам налаштовувати обсяг обмірковування для максимізації продуктивності“. Це дає розробникам так званий “бюджет на обмірковування” — можливість платити за розширені можливості міркування лише тоді, коли це дійсно необхідно. З увімкненою функцією міркування вартість обробки зростає з $0.60 до $3.50 за мільйон токенів.
Якщо розробники не вказують бюджет, модель самостійно визначає необхідний рівень обмірковування, аналізуючи складність запиту. Наприклад, вона розрізняє прості запити (на кшталт “Скільки штатів у США?”) та складні багатоетапні математичні задачі. Google зазначає, що для збереження швидкості та вартості на рівні Flash 2.0 розробникам слід встановити бюджет на нуль.
У тестуванні “Останній іспит людства” (Humanity’s Last Exam, HLE) — новому альтернативному бенчмарку, створеному через те, що стандартні галузеві тести стали занадто простими для сучасних ШІ — Gemini 2.5 Flash набрала 12%. Цей показник вищий, ніж у конкурентних моделей, таких як Claude 3.7 Sonnet та DeepSeek R1, однак поступається нещодавно випущеній o4-mini від OpenAI, яка отримала 14%.
Спробувати Gemini 2.5 Flash у попередньому режимі можна через Gemini API в Google AI Studio та Vertex AI.