Раніше цього місяця генеральний директор OpenAI Сем Альтман поділився дорожньою картою для своїх майбутніх моделей, GPT-4.5 і GPT-5. У пості X Альтман повідомив, що GPT-4.5, який має внутрішню кодову назву Orion, стане останньою моделлю, яка не буде працювати за принципом «ланцюжка думок». В іншому, деталі моделі залишалися таємницею – до сьогоднішнього дня.
GPT-4.5 запущено
27 лютого вранці OpenAI оголосила, що проведе пряму трансляцію через 4,5 години, натякаючи на свою останню і найкращу модель. Під час прямого ефіру OpenAI представила GPT-4.5 в дослідницькій попередній версії, яка, за словами компанії, є «найбільшою і найбільш наукомісткою моделлю».
GPT-4.5 has entered the Chat.https://t.co/tBzJxSyCeY
— OpenAI (@OpenAI) February 27, 2025
За словами представників OpenAI, користувачі повинні відчути загальне поліпшення при використанні GPT-4.5, що означає меншу кількість галюцинацій, більш чітке узгодження з їхніми намірами і поліпшення емоційного інтелекту. Загалом, взаємодія з моделлю має бути більш інтуїтивною та природною, ніж з попередніми моделями, в основному завдяки глибшим знанням та кращому розумінню контексту.
Навчання без нагляду, яке покращує знання слів та інтуїцію, і міркування – були двома методами, що сприяли покращенню моделі. Хоча ця модель не пропонує міркування за ланцюжком думок, як модель міркувань o1 від OpenAI, вона все одно забезпечує вищий рівень міркувань з меншим запізненням та іншими покращеннями, такими як усвідомлення соціальних підказок.
Наприклад, у демо-версії ChatGPT попросили вивести текст, який містив заклик до ненависті, одночасно використовуючи GPT-4.5 і o1. Версія o1 зайняла трохи більше часу і видала лише одну відповідь, яка сприйняла повідомлення про ненависть дуже серйозно і звучала дещо різко. Модель GPT-4.5 запропонувала дві різні відповіді, одна з яких була більш легкою, а інша – більш серйозною. Жодна з них не містила прямої згадки про ненависть; скоріше, вони висловлювали своє розчарування тим, як «користувач» вирішив поводитися.
Читайте також: Як зробити ChatGPT пошуковою системою за замовчуванням у Chrome, Edge та інших браузерах
Аналогічно, коли обидві моделі попросили надати інформацію на технічну тему, GPT-4.5 надала відповідь, яка протікала більш природно, порівняно з більш структурованим результатом o1. Зрештою, GPT-4.5 призначена для повсякденних завдань на різні теми, включаючи написання і вирішення практичних завдань.
Щоб досягти цих покращень, модель навчали з використанням нових методів навчання, а також традиційних, таких як точне налаштування під наглядом (SFT) та навчання з підкріпленням на основі зворотного зв’язку з людиною (RLHF).
Під час прямої трансляції OpenAI здійснив подорож у глиб пам’яті, попросивши всі свої попередні моделі, починаючи з GPT-1, відповісти на запитання «Чому вода солона?». Як і очікувалося, кожна наступна модель давала кращу відповідь, ніж попередня. Особливістю GPT-4.5 стало те, що OpenAI назвав її «великою індивідуальністю», яка зробила відповідь легшою, більш розмовною і більш привабливою для читання завдяки використанню таких прийомів, як алітерації.
Модель інтегрується з деякими з найдосконаліших функцій ChatGPT, включаючи пошук, канву, завантаження файлів і зображень. Вона не буде доступна в мультимодальних функціях, таких як голосовий режим, відео та спільний доступ до екрану. У майбутньому OpenAI планує зробити перехід між моделями більш плавним і не залежатиме від вибору моделі.
Тестування продуктивності
Звичайно, це не був би реліз моделі без занурення в бенчмарки. За деякими з основних тестів, що використовуються для оцінки цих моделей, зокрема Competition Math (AIME 2024), PhD-level Science Questions (GPQA Diamond) та SWE-Bench verified (кодування), GPT-4.5 перевершила GPT-4o, свою попередню універсальну модель.

Найголовніше, що в порівнянні з OpenAI o3-mini – нещодавно запущеною моделлю міркувань OpenAI, яка навчилася думати, перш ніж говорити, – GPT-4.5 виявився набагато ближче, ніж GPT-4o, і навіть випередив o3-mini в бенчмарках SWE-Lancer Diamond (кодування) і MMMLU (багатомовність).
Велике занепокоєння при використанні генеративних моделей ШІ викликає їхня схильність до галюцинацій або включення невірної інформації у відповіді. Дві різні оцінки галюцинацій, SimpleQA Accuracy і SimpleQA Hallucination, показали, що GPT-4.5 був більш точним і менше галюцинував, ніж GPT-4o, o1 і o3-mini.

Результати порівняльних оцінок з людьми-тестерами показали, що GPT-4.5 є кращою моделлю, ніж GPT-4o. Зокрема, люди-тестери надали їй перевагу в повсякденних, професійних і творчих запитах.
Безпека
Як завжди, OpenAI запевнила громадськість, що моделі були визнані достатньо безпечними для випуску, провівши стрес-тестування моделі і детально описавши ці результати в супровідній системній картці. Компанія також додала, що з кожним новим релізом і збільшенням можливостей моделі з’являються можливості зробити її безпечнішою. З цієї причини у версії GPT-4.5 компанія поєднала нові методи контролю з RLHF.
Читайте також: Поради щодо конфіденційності в ChatGPT: 2 важливі способи обмежити дані, якими ви ділитеся з OpenAI
Доступність
GPT-4.5 наразі знаходиться в дослідницькій версії для Pro користувачів, доступній через пікап моделі на веб-сторінці, мобільних пристроях та настільних комп’ютерах. Якщо ви не хочете витрачати 200 доларів на підписку Pro, OpenAI повідомила, що почне розгортати GPT-4.5 для користувачів Plus і Team наступного тижня, а потім для користувачів Enterprise і Edu наступного тижня.
Альтман поділився на X, що метою було запустити модель для користувачів Pro і Plus одночасно, але це «гігантська, дорога модель». Він додав, що оскільки у компанії закінчилися графічні процесори, наступного тижня вона додасть десятки тисяч графічних процесорів і тоді випустить модель для Plus.
За даними OpenAI, модель також доступна для попереднього перегляду розробникам на всіх платних рівнях використання в Chat Completions API, Assistants API та Batch API.