
GPT-5.5: 20 százalékkal magasabb ár az API-n, 86 százalékos hallucináció az OpenAI új modelljében
Az új modell 60 ponttal veri a Claude Opus 4.7 és a Gemini 3.1 Pro Preview riválisokat az Artificial Analysis Intelligence Indexen.
GPT, Claude, Gemini és más generatív AI modellek, agents, multimodális rendszerek

Az új modell 60 ponttal veri a Claude Opus 4.7 és a Gemini 3.1 Pro Preview riválisokat az Artificial Analysis Intelligence Indexen.

A DeepSeek új V4 modelljének előzetes verziói olcsóbbak a riválisoknál, de nem hoztak jelentős áttörést az amerikai AI-képességekkel szemben.

A mesterséges intelligencia fejlesztése a következő hónapokban felgyorsulhat. Rövid távon jelentős, középtávon rendkívül jelentős javulásokra számítanak.

A modell a ZDNET 10 körös tesztjén 100-ból 93 pontot szerzett, különösen írási, kódolási és érvelési feladatokban mutatott erős teljesítményt.

Az új verzió már képes hosszú szövegtömböket, felhasználói felületeket és térképeket is hibátlanul megjeleníteni, sőt, akár Sam Altmanról is készít képeket.

A kínai startup a V4 Flash és V4 Pro modelleket a legerősebb nyílt forráskódú platformként pozicionálja, kihívást intézve az OpenAI és Anthropic felé.

A GPT-5.5 modell a legokosabb és legintuitívabb az OpenAI kínálatában, jelentősen felülmúlva elődjét, a GPT-5.4-et. Kiemelkedően teljesít olyan feladatokban, mint a kódírás és hibakeresés.

A modell a gyártó készülő „szuperalkalmazásának” alapját képezi, amelyhez ügynök-AI képességeket is kapott.

Az OpenAI bemutatta a GPT-5.5-ös modellt, amely minimális irányítással is képes elvégezni a komplex feladatokat. Ez a képessége kulcsfontosságú lesz a cég készülő szuperalkalmazásához.

A minőségromlás három fő okra vezethető vissza: gondolkodási erőfeszítés csökkentése, memóriahiba és prompt-változás. A hibákat április 20-ig orvosolták.

Az új modell a kódírástól az adatelemzésig számos területen nyújt segítséget, és már a kiadás előtt közel 200 partner visszajelzéseit gyűjtötték össze.

Az új ügynök-alapú modell önállóan képes komplex feladatok kezelésére, mint a kódírás, online keresés és adatelemzés, miközben az API-hozzáférés ára megduplázódik.

A TEGNet nevű eszköz a hulladékhő elektromos árammá alakítását gyorsítja fel, ami eddig lassú szimulációkat és kísérleteket igényelt.

A rendszer a nagyméretű nyelvi modellek (LLM) kognitív képességeit ötvözi a diffúziós transzformerek pixel-szintézisével, így pontosabban fordítja le a felhasználói szándékot vizuális kimenetté.

Az új módszerrel a vállalat finomhangolt llama3.1-nemotron-nano-8B-v1 modellje 18-33%-kal alacsonyabb késleltetéssel dolgozik, hardverköltés nélkül.

A mesterséges intelligencia fejlesztője a modell veszélyes képességei miatt a kockázatokat is nyilvánosságra hozza, miközben szigorúan korlátozza a hozzáférést.

A modell mérete mindössze 55,6 GB, ami jelentősen kisebb, mint a korábbi verzióé, miközben a kódolási teljesítménye zászlóshajó szintű marad.

A modell képes önállóan eldönteni, hogy a válaszadáshoz szüksége van-e a webkamera képére, mindezt egy 8 GB RAM-mal szerelt, helyi eszközön.

A Granite-4.1-8B a Granite-4.1-8B-Base alapmodellből finomhangolt változat, amely nyílt forráskódú és belső, szintetikus adatkészleteket is felhasznál.

A GPT-Image-2 modell az első helyen áll az Image Arena összes kategóriájában. Az API-n és a ChatGPT-n keresztül is elérhető.

Az OpenAI vezérigazgatója egy podcastben bírálta az Anthropic új kiberbiztonsági modelljét, amelynek nyilvános kiadását a cég túl veszélyesnek ítéli.
Tetszik az oldal? Támogasd a fejlesztést
Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.