Az OpenAI GPT-Image-2 modellje 242 Elo ponttal vezeti az Image Arena ranglistát
A GPT-Image-2 modell az első helyen áll az Image Arena összes kategóriájában. Az API-n és a ChatGPT-n keresztül is elérhető.

Új képgeneráló modellt mutatott be az OpenAI: a GPT-Image-2 már elérhető az API-n és a ChatGPT felületén is. A modell a gyártó szerint erősebb szövegmegjelenítést, elrendezési hűséget, szerkesztési képességeket és többnyelvű támogatást kínál — írja az AINews.
Az Arena ranglistái szerint a GPT-Image-2 az első helyen áll minden Image Arena kategóriában, a szövegből képet generáló feladatokban pedig +242 Elo ponttal előzi meg a következő modellt. A független visszajelzések alapján a modell különösen hasznos UI-tervezéshez, mock-upokhoz, dokumentációhoz és referencián alapuló tervezési folyamatokhoz.
A GPT-Image-2 képes a webes keresésre, ha egy „gondolkodó” modellel párosítják, több jelöltet generál, ellenőrzi a kimeneteket, és olyan vizuális elemeket készít, mint diák, infografikák, diagramok, UI mock-upok és QR-kódok. A modell már integrálva van olyan eszközökbe, mint a Figma, a Canva, a Firefly, a fal és a Hermes Agent.
Érdekesség, hogy a modell „gondolkodó” és „nem gondolkodó” változatban is létezik. A képgenerálás egyre inkább a kódgeneráló ügynökök front-endjévé válik: egy UI specifikációt képként generálnak, majd egy kódügynök, például a Codex, implementálja a vizuális referenciát.
A GPT-Image-2 bevezetése a Sora csapatának állítólagos leállítása és távozása után történt, ami meglepővé teszi, hogy a képgenerálás továbbra is prioritás az OpenAI számára. A bejelentés napján a Cursor 10 milliárd dolláros szerződést kötött a xAI-val, és opciót szerzett a cég 60 milliárd dollárért történő felvásárlására.