Що може бути краще, ніж чат-бот зі штучним інтелектом, який може допомогти вам у виконанні завдань? Той, який може зробити це за вас. OpenAI продовжує створювати своїх ШІ-агентів у ChatGPT, запустивши Deep Research.
Deep Research
У неділю OpenAI представила Deep Research – агента штучного інтелекту, який може проводити багатокрокові дослідження для вас, витягуючи велику кількість інформації з Інтернету і синтезуючи ці джерела у вичерпний звіт. Після отримання запиту Deep Research може працювати повністю самостійно; це все одно, що мати у своєму розпорядженні дослідницького аналітика.
Today we are launching our next agent capable of doing work for you independently—deep research.
Give it a prompt and ChatGPT will find, analyze & synthesize hundreds of online sources to create a comprehensive report in tens of minutes vs what would take a human many hours. pic.twitter.com/03PPi4cdqi
— OpenAI (@OpenAI) February 3, 2025
В основі Deep Research лежить версія моделі OpenAI o3, оптимізована для веб-перегляду та аналізу даних. Використовуючи розширені можливості міркувань o3, він може шукати та інтерпретувати величезні обсяги контенту з Інтернету, включаючи тексти, зображення та інше, а потім виводити його у вигляді звіту, орієнтованого на ваші потреби.
Кожен звіт створюється від п’яти до 30 хвилин, залежно від поставленого завдання. Однак у цей час ви можете працювати над іншими завданнями, оптимізуючи продуктивність робочого процесу. Готовий звіт виводиться в чат. У найближчі тижні агент також додасть зображення, візуалізації даних та багато іншого.
За даними OpenAI, на таку ж роботу людині знадобилося б кілька годин. Крім того, передбачається, що агент буде особливо добре знаходити вузькоспеціалізовану інформацію, для пошуку якої людині довелося б здійснювати кілька запитів.
За даними OpenAI, цільова аудиторія Deep Research – це ті, хто інтенсивно працює з знаннями у сфері фінансів, науки, політики та інженерії – і хто потребує надійних, ретельних досліджень. Окрім звичайних текстових запитань, користувачі можуть завантажувати файли, включаючи PDF-файли та електронні таблиці. Кожен звіт містить чіткі цитати та короткий виклад думок агента, щоб користувачі могли самостійно перевірити інформацію.
Повторна перевірка відповідей чат-бота – це, як правило, хороша практика, оскільки чат-боти схильні до галюцинацій. Зокрема, OpenAI попереджає, що Deep Research «іноді може галюцинувати факти у відповідях або робити неправильні висновки, хоча, згідно з внутрішніми оцінками, це відбувається значно рідше, ніж в існуючих моделях ChatGPT». OpenAI також додає, що агенту важко відрізнити достовірну інформацію від чуток і він може неправильно передати невизначеність, що підкреслює необхідність людського контролю. Користувачі також можуть помітити деякі помилки форматування. «Ми очікуємо, що всі ці проблеми швидко вирішаться з ростом використання та часом», – зазначають у компанії.
Порівняння продуктивності
У блозі, де анонсується ця функція, OpenAI наводить ті ж самі результати GPT-4o і Deep Research, щоб продемонструвати, як однакові підказки генерують дуже різні результати. Результати, отримані за допомогою Deep Research, були набагато надійнішими і краще організованими.
Deep Research також перевершив GPT-4o в «Останньому іспиті людства» – нещодавно запущеному тестовому іспиті зі штучного інтелекту від Scale AI та Центру безпеки штучного інтелекту (CAIS), який тестує різних суб’єктів на знання питань на рівні експертів. Точність Deep Research склала 26,6%, перевершивши результати GPT-4o, Grok-2, Claude 3,5 Sonnet, Gemini Thinking, o1 і навіть o3-mini high, який набрав найвищий бал за кілька днів до цього, як підкреслив генеральний директор OpenAI Сем Альтман.
OpenAI також опублікувала результати Deep Research в ряді інших оцінок, включаючи GAIA, публічний бенчмарк, який оцінює ШІ у вирішенні реальних завдань, і внутрішню оцінку завдань експертного рівня в різних сферах глибоких досліджень. В обох випадках Deep Research продемонструвала вражаючі результати, навіть очоливши зовнішню таблицю лідерів GAIA.
Як отримати доступ
Через обчислювальну потужність, необхідну для запуску функції Deep Research, доступ до неї наразі мають лише користувачі ChatGPT Pro. Підписка вартістю 200 доларів на місяць включає доступ до 100 запитів оптимізованої версії та інші переваги, такі як необмежений доступ до ChatGPT і Sora, а також доступ до Operator, агента зі штучним інтелектом, який може виконувати основні завдання браузера, наприклад, бронювання.
Першими доступ отримають користувачі ChatGPT Plus і Team, потім – Enterprise, а потім – вільні користувачі. OpenAI повідомляє, що планує випустити швидшу та економічно ефективнішу версію функції, яка працюватиме на основі меншої за розміром, але такої ж ефективної моделі.
Якщо ви хочете отримати доступ до цієї функції вже зараз, але не хочете витрачати 200 доларів на місяць, Google пропонує аналогічну функцію під назвою Deep Research, яка доступна всім користувачам Gemini Advanced через план Google One AI Premium, що коштує 20 доларів на місяць.
У грудні Альтман навіть відповів користувачеві X, який попросив Альтмана «зробити функцію глибокого дослідження, як у Gemini, але краще», написавши «kk», припускаючи, що нещодавно випущена функція Deep Research є відповіддю OpenAI на Google.
Минулого тижня Microsoft також анонсувала функцію більш глибоких міркувань під назвою Think Deeper, яка дозволяє користувачам використовувати модель міркувань OpenAI O1 для отримання більш якісних відповідей на складні підказки. Однак, на відміну від Gemini та функції глибокого дослідження OpenAI, вона не має агентських можливостей та доступу до інтернету. Найбільша перевага полягає в тому, що цей досвід є повністю безкоштовним.