OpenAI GPT Image 1.5: революційний генератор зображень

OpenAI випустила новий генератор зображень ChatGPT, що спрощує процес редагування фотографій до простого набору речення. Цей інструмент, названий GPT Image 1.5, дозволяє користувачам змінювати зображення, не маючи спеціальних навичок у фотографії або редагуванні.

Випуск відбувся у вівторок, і модель генерує зображення вчетверо швидше, ніж попередники, і коштує на 20% менше через API. Це вже не перший подібний продукт на ринку. Google раніше презентувала свою модель Nano Banana, що отримала позитивний відгук у спільноті штучного інтелекту.

GPT Image 1.5 є “рідним мультимодальним” моделлю, що означає, що генерація зображень відбувається в одному нейронному мережевому просторі з обробкою текстових запитів. Це дозволяє моделі простіше змінювати позу людей або їхнє оточення, а також змінювати стилі і деталі, зберігаючи при цьому впізнаваність осіб.

Користувачі можуть взаємодіяти з моделлю, обговорюючи фотографії та уточнюючи зміни, так само, як це роблять під час роботи над електронним листом у ChatGPT.