Frissítve: 2 órája·Ma: 14
Modellek & LLM
AI által generált szöveg

ChatGPT Images 2.0: szöveges infografikákat és térképeket is generál az OpenAI új modellje

Az új verzió már képes hosszú szövegtömböket, felhasználói felületeket és térképeket is hibátlanul megjeleníteni, sőt, akár Sam Altmanról is készít képeket.

ChatGPT Images 2.0: szöveges infografikákat és térképeket is generál az OpenAI új modellje
Fotó: Daria Nepriakhina 🇺🇦 / Unsplash
Forrás: VentureBeatSzerző: AI Forradalom szerk.
Megosztás

Hónapokkal a GPT-Image-1.5 decemberi kiadása után az OpenAI most bemutatta a ChatGPT Images 2.0-t, amely jelentős előrelépést hoz a mesterséges intelligencia alapú képgenerálásban — írja a VentureBeat.

Az új modell, amely hetek óta „duct tape” néven volt elérhető a LM Arena AI tesztplatformon, már minden ChatGPT-előfizető számára hozzáférhető. Az OpenAI szerint a 2.0-ás verzió képes alaprajzokat, képrácsokat, több szögből ábrázolt karaktermodelleket is előállítani, és ezeket a funkciókat feltöltött képekre is alkalmazza.

A mesterséges intelligencia művészi oldala

Az Images 2.0 legfontosabb technikai újítása az OpenAI „O-series” érvelési képességeinek integrálása. A korábbi képgeneráló modellekkel ellentétben, amelyek fekete dobozként működtek, az Images 2.0 „ügynöki” megközelítést alkalmaz. Amikor a felhasználó kiválasztja a „Thinking” (Gondolkodás) modellt a ChatGPT-ben, a rendszer nem csupán rajzol, hanem kutat, tervez és érvel a kép szerkezetéről, mielőtt az első pixel megjelenne.

Adele Li, az OpenAI ChatGPT Images termékvezetője egy sajtótájékoztatón bemutatta, hogyan dolgozott fel a modell egy komplex PowerPoint fájlt belső termékstratégiákról. A modell nem csupán egy kapcsolódó képet generált, hanem szintetizálta a dokumentum alapadatait, azonosította a megfelelő logókat, és professzionális posztert készített, megőrizve az eredeti fájl stiláris elemeit.

Képfeldolgozás a jövőben

A modell a tipográfia, a nyelvi sokféleség és a szekvenciális konzisztencia terén is kiemelkedő. Az OpenAI szerint az Images 2.0 „lépésváltást” jelent a szövegek olvasható megjelenítésében, még sűrű kompozíciókban is, mint például tudományos diagramokon vagy infografikákon. A GPT-Image-1.5 modellt fokozatosan kivezetik, de API-n keresztül továbbra is elérhető marad a korábbi támogatás miatt. A modell tudásbázisának legfrissebb vágása 2025 decemberi.

Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom