OpenAI випустила новий генератор зображень ChatGPT, що спрощує процес редагування фотографій до простого набору речення. Цей інструмент, названий GPT Image 1.5, дозволяє користувачам змінювати зображення, не маючи спеціальних навичок у фотографії або редагуванні.
Випуск відбувся у вівторок, і модель генерує зображення вчетверо швидше, ніж попередники, і коштує на 20% менше через API. Це вже не перший подібний продукт на ринку. Google раніше презентувала свою модель Nano Banana, що отримала позитивний відгук у спільноті штучного інтелекту.
GPT Image 1.5 є “рідним мультимодальним” моделлю, що означає, що генерація зображень відбувається в одному нейронному мережевому просторі з обробкою текстових запитів. Це дозволяє моделі простіше змінювати позу людей або їхнє оточення, а також змінювати стилі і деталі, зберігаючи при цьому впізнаваність осіб.
Користувачі можуть взаємодіяти з моделлю, обговорюючи фотографії та уточнюючи зміни, так само, як це роблять під час роботи над електронним листом у ChatGPT.
