Переглядаючи цей сайт, ви погоджуєтесь з нашою політикою конфіденційності
Прийняти
  • Про нас
  • Політика конфіденційності
  • Контакти
CyberCalm
  • Новини
  • Кібербезпека
    КібербезпекаПоказати ще
    ШІ Google виявив 5 нових уразливостей у Safari
    ШІ Google виявив 5 нових уразливостей у Safari: що потрібно знати користувачам Apple
    2 дні тому
    students cybersecurity
    Чек-лист кібербезпеки для студентів: 12 порад для захисту в університеті
    4 дні тому
    CISA та NSA випустили термінові рекомендації для захисту WSUS та Microsoft Exchange серверів
    CISA та NSA випустили термінові рекомендації для захисту WSUS та Microsoft Exchange серверів
    4 дні тому
    Чи варто довіряти Grokipedia? Науковці оцінили AI-енциклопедію Ілона Маска
    Чи варто довіряти Grokipedia? Науковці оцінили AI-енциклопедію Ілона Маска
    5 днів тому
    Що таке комп'ютер зі штучним інтелектом
    Введіть цю фразу в пошук — і знайдете конфіденційні корпоративні документи в інтернеті
    5 днів тому
  • Гайди та поради
    Гайди та поради
    Корисні поради, які допоможуть вам почуватися безпечно в мережі, а також маленькі хитрощі у користуванні вашими гаджетами.
    Показати ще
    Топ-новини
    Як перенести Telegram на інший телефон
    Як перенести Telegram на інший телефон. ІНСТРУКЦІЯ
    7 місяців тому
    Як записувати телефонні дзвінки на iPhone
    Як записувати телефонні дзвінки на iPhone
    1 місяць тому
    Як підготувати комп'ютер до продажу
    Як підготувати комп’ютер до продажу: ІНСТРУКЦІЯ
    6 місяців тому
    Останні новини
    Що означають кольори USB-портів (і які з них потужніші за інші)
    4 дні тому
    Як виявити програми для стеження на вашому ноутбуці
    1 тиждень тому
    Чорний екран смерті на Windows: 7 кроків для виправлення проблеми
    2 тижні тому
    Як очистити кеш на телевізорі (і навіщо це робити)
    2 тижні тому
  • Статті
    Статті
    Цікаві статті про світ технологій, інтернет та кіберзахист. Розбираємо складні теми, від штучного інтелекту до безпеки даних та Big Data. Аналітика для допитливих та професіоналів.
    Показати ще
    Топ-новини
    Чому завершення підтримки Windows 10 — це чудова новина для Linux і шанс перейти на нову систему
    Чому завершення підтримки Windows 10 — це чудова новина для Linux і шанс перейти на нову систему
    2 тижні тому
    newsroom deepfake feat
    Діпфейки: чому це так небезпечно?
    7 місяців тому
    Що таке глибоке навчання? Все, що вам потрібно знати
    Що таке глибоке навчання? Все, що вам потрібно знати
    7 місяців тому
    Останні новини
    Шахрайські оголошення у Facebook, Instagram та WhatsApp приносять Meta мільярди доларів — розслідування
    16 години тому
    Штучний інтелект стає інтроспективним – і це потребує ретельного моніторингу, попереджає Anthropic
    2 дні тому
    Штучний інтелект належить людству, а не наддержавам
    3 дні тому
    Які обрати навушники: дротові чи бездротові?
    3 дні тому
  • Огляди
    ОглядиПоказати ще
    iOS 26.1 вже доступна: всі зміни для вашого iPhone
    Головні нововведення iOS 26.1: детальний огляд усіх функцій
    3 дні тому
    Surfshark та Proton VPN: порівняння кращих VPN-сервісів
    Surfshark та Proton VPN: порівняння кращих VPN-сервісів
    5 днів тому
    clamav
    Антивірус, якому можна довіряти на Linux — і він безкоштовний
    2 тижні тому
    Gemini Google Home плутає собак з котами, але покращує автоматизацію розумного дому
    Gemini Google Home плутає собак з котами, але покращує автоматизацію розумного дому
    2 тижні тому
    Донгл для ремонту телефону за $5: результати тестування розчаровують
    Донгл для ремонту телефону за $5: результати тестування розчаровують
    3 тижні тому
  • Теми
    • Комп’ютери
    • Смартфони
    • Windows
    • Linux
    • Android
    • iOS
    • Штучний інтелект
    • Розумний будинок
  • Архів
Техногіганти
  • Google
  • Apple
  • Samsung
  • Microsoft
  • Meta
  • OpenAI
Соцмережі
  • Facebook
  • Instagram
  • YouTube
  • TikTok
  • X (Twitter)
  • Threads
Спеціальні теми
  • Кібервійна
  • Безпека дітей в Інтернеті
  • Маніпуляції в медіа
Читання: ChatGPT нарешті може генерувати зображення з розбірливим текстом
Розмір шрифтаAa
CyberCalmCyberCalm
Пошук
  • Новини
    • Комп’ютери
    • Смартфони
    • Соцмережі
    • Google
    • Android
    • Apple
    • Windows
    • Linux
    • Штучний інтелект
    • Безпека дітей в інтернеті
  • Кібербезпека
  • Гайди та поради
  • Статті
  • Огляди
  • Архів
Follow US
  • Про проєкт Cybercalm
  • Політика конфіденційності
  • Контакти
© 2025 Cybercalm. All Rights Reserved.
Головна / Новини / ChatGPT нарешті може генерувати зображення з розбірливим текстом

ChatGPT нарешті може генерувати зображення з розбірливим текстом

Наталя Зарудня
ByНаталя Зарудня
Головний редактор
Досвід роботи у галузі кібербезпеки понад 10 років. Пишу про штучний інтелект, соціальні мережі, історію технологій.
Слідкуйте:
8 місяців тому
Поширити
5 хв. читання
ChatGPT нарешті може генерувати зображення з розбірливим текстом

У ChatGPT тепер можна генерувати зображення з GPT-4o. Нова модель генерації зображень, яка прийшла на зміну DALL-E 3, відрізняється точнішим відображенням тексту, покращеними можливостями «прив’язки» і простотою використання.

На відміну від традиційної дифузійної методології генерації зображень, яка «зафарбовує» деталі поверх випадкового шуму, GPT-4o використовує систему авторегресії зверху-вниз, збоку-вбік. Це повільніше, ніж дифузія, але переваги авторегресії очевидні. GPT-4o здатний генерувати зображення з ідеально розбірливим текстом – те, чого постійно не вдавалося досягти моделям зі штучним інтелектом, таким як DALL-E 3.

Мало того, ви можете вказати текстовий вміст для згенерованих зображень. Напишіть запит на кшталт «дай мені фотореалістичне зображення дівчини, яка пише на дошці від руки», скажіть ШІ будь-які слова, які ви хочете бачити на дошці, і він видасть вам щось досить точне. І, що, мабуть, ще важливіше, модель досить добре пише 2D-стилізований текст для ресторанних меню, рекламних оголошень та інших речей, які можуть бути корисними для бізнесу або любителів.

- Advertisement -

Авторегресійний підхід також допомагає з «прив’язкою» – простіше кажучи, ШІ не плутається в підказках, які містять кілька предметів. Якщо попросити DALL-E 3 намалювати червоне коло, синій трикутник, зелене серце, рожеву зірку і фіолетовий квадрат, він може заплутатись і згенерувати неправильні фігури або кольори. GPT-4o, з іншого боку, може точно обробляти до 20 різних об’єктів.

У поєднанні з можливостями рендерингу тексту, покращена прив’язка створює цікаві можливості для корпоративного мистецтва або реклами, хоча це також просто корисна річ, яка полегшує генерацію зображень.

Звичайно, GPT-4o генерує зображення просто «краще», ніж DALL-E 3. Фотореалістичні зображення виглядають більш наближеними до життя, цифрове мистецтво виглядає менш розмитим або зернистим, а нові методи виведення зменшують необхідність друкувати довгі, складні підказки. Модель також може похвалитися покращеною «узгодженістю символів», що означає, що символ або об’єкт, згенерований в одній підказці, може бути точно перенесений у наступні підказки – якщо ви скажете ШІ повторно використати кіборга-кішку, яку він створив, він не змінить колір кішки тощо.

OpenAI визнає, що його нова модель генерації зображень недосконала. Вона все ще бореться з галюцинаціями, математичними зображеннями (наприклад, діаграмами або графіками), багатомовним текстом тощо. Проте, це, безумовно, покращення порівняно з попередніми моделями генерації зображень компанії.

Також: Використання ChatGPT викликає відчуття самотності, – Дослідження

OpenAI стверджує, що генерація зображень GPT-4o містить засоби захисту для запобігання зловживанню, а також вдосконалені методи нанесення водяних знаків, щоб допомогти людям відрізнити контент, створений ШІ, від справжнього, створеного людиною. Але я ризикну припустити, що ці запобіжники можна обійти, якщо докласти певних зусиль. І OpenAI все ще використовує водяні знаки C2PA, які є лише метаданими. Потрібно дуже мало зусиль, щоб видалити ці метадані з зображення – C2PA неефективний для запобігання поширенню дезінформації.

Новий генератор зображень GPT-4o також не зменшить занепокоєння щодо авторських прав чи добросовісного використання. Згідно із заявою, наданою The Wall Street Journal, він навчався на суміші «загальнодоступних» і ліцензованих даних. ШІ-компанії, як відомо, нахабно ігнорують базові закони про авторське право, а OpenAI не ділиться своїми навчальними даними з громадськістю, тож не соромтеся робити власні висновки з цього приводу. (До речі, OpenAI дійсно піклується про авторські права, коли її роботу крадуть).

Генерувати зображення з GPT-4o можна вже сьогодні. Просто відкрийте ChatGPT у вашому браузері, попросіть ШІ згенерувати зображення і насолоджуйтеся. Зверніть увагу, що впровадження не завершено, тому деякі користувачі все ще можуть зіткнутися зі старою моделлю DALL-E 3.

Генератор зображень GPT-4o
Генератор зображень GPT-4o

 

- Advertisement -

Найкращий спосіб визначити різницю – поспостерігати, як завантажується згенероване зображення. DALL-E 3 завантажує зображення за допомогою колеса, що обертається, в той час як зображення GPT-4o завантажуються за допомогою приємної анімації, що нагадує рух планшетного сканера зверху вниз з боку в бік.

Всі користувачі ChatGPT мають доступ до генерації зображень GPT-4o, включно з безкоштовними користувачами. Однак, безкоштовні користувачі стикаються з обмеженнями у використанні, як і при використанні DALL-E 3. До речі, DALL-E 3 залишиться доступним у користувацьких форматах GPT для тих, хто хоче ним користуватися.

О, привіт 👋
Приємно познайомитися!

Підпишіться, щоб щотижня отримувати найцікавіші статті на свою поштову скриньку.

Ми не розсилаємо спам! Ознайомтеся з нашою політикою конфіденційності для отримання додаткової інформації.

Перевірте свою поштову скриньку або папку зі спамом, щоб підтвердити підписку.

ТЕМИ:ChatGPTDALL-E 3GPT-4oOpenAIШтучний Інтелект
ДЖЕРЕЛО:OpenAI
Поділитися
Facebook Threads Копіювати посилання Друк
Що думаєте?
В захваті0
Сумно0
Смішно0
Палає0
Овва!0
Попередня стаття Як змінити ім'я користувача у X (Twitter)? - ІНСТРУКЦІЯ Як змінити ім’я користувача у X (Twitter)? – ІНСТРУКЦІЯ
Наступна стаття Як розпізнати небезпечні вкладення та шкідливе ПЗ в електронній пошті Як розпізнати небезпечні вкладення та шкідливе ПЗ в електронній пошті

В тренді

Що означають кольори USB-портів (і чому деякі з них потужніші за інші)
Що означають кольори USB-портів (і які з них потужніші за інші)
4 дні тому
Surfshark та Proton VPN: порівняння кращих VPN-сервісів
Surfshark та Proton VPN: порівняння кращих VPN-сервісів
5 днів тому
Що таке комп'ютер зі штучним інтелектом
Введіть цю фразу в пошук — і знайдете конфіденційні корпоративні документи в інтернеті
5 днів тому
Microsoft Bob залишається найнезграбнішим продуктом компанії Microsoft
Microsoft Bob залишається найнезграбнішим продуктом компанії Microsoft
5 днів тому
Штучний інтелект стає інтроспективним - і це потребує ретельного моніторингу, попереджає Anthropic
Штучний інтелект стає інтроспективним – і це потребує ретельного моніторингу, попереджає Anthropic
2 дні тому

Рекомендуємо

ШІ Google виявив 5 нових уразливостей у Safari
Кібербезпека

ШІ Google виявив 5 нових уразливостей у Safari: що потрібно знати користувачам Apple

2 дні тому
Коли машини керують: Чи може штучний інтелект замінити парламент?
Статті

Штучний інтелект належить людству, а не наддержавам

3 дні тому
Amazon та Perplexity борються за майбутнє AI-шопінгу
Новини

Amazon та Perplexity борються за майбутнє AI-шопінгу

3 дні тому
Чи зроблять нові оновлення ChatGPT безпечнішим для психічного здоров'я
Кібербезпека

Чи зроблять нові оновлення ChatGPT безпечнішим для психічного здоров’я?

1 тиждень тому
CyberCalmCyberCalm
Follow US
© 2025 Cybercalm. All Rights Reserved.
  • Про проєкт Cybercalm
  • Політика конфіденційності
  • Контакти
Cybercalm
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?