Повідомлення Gate News, 22 квітня — OpenAI почала розгортання ChatGPT Images 2.0 21 квітня для всіх користувачів ChatGPT і Codex, причому платні користувачі можуть генерувати більш просунуті результати. Компанія запустила API gpt-image-2 з ціноутворенням, що залежить від якості виходу та роздільної здатності.
Нова модель покращує рендеринг дрібного тексту та елементів інтерфейсу, підтримує скрипти, зокрема японську, корейську, хінді та бенгальську, і точніше виконує детальні інструкції. Images 2.0 додає можливості «thinking», що дозволяє моделі шукати в інтернеті інформацію в реальному часі, генерувати кілька різних зображень з одного запиту та уточнювати виходи для точності й узгодженості. Складні генерації можуть тривати кілька хвилин; у моделі є обмеження знань до грудня 2025 року.
OpenAI не розкрила архітектуру моделі. Для контексту щодо цін: Imagen 4 від Google коштує $0.02 to $0.06 за зображення, тоді як генерація 10,000 зображень із GPT Image 1 Mini в режимі низької якості коштує приблизно $50, порівняно приблизно з $1,670 для виходу високої якості.