Frissítve: 2 órája·Ma: 14
Modellek & LLM
AI által generált szöveg

93 pontot ért el a GPT-5.5 a ZDNET tesztjén – figyelmen kívül hagyja az utasításokat

A modell a ZDNET 10 körös tesztjén 100-ból 93 pontot szerzett, különösen írási, kódolási és érvelési feladatokban mutatott erős teljesítményt.

93 pontot ért el a GPT-5.5 a ZDNET tesztjén – figyelmen kívül hagyja az utasításokat
Fotó: Daniil Komov / Unsplash
Forrás: ZDNet AISzerző: AI Forradalom szerk.
Megosztás

Újabb nagyméretű nyelvi modellt (LLM) adott ki az OpenAI: a GPT-5.5 a ZDNET szerint jobb és gyorsabb, mint elődje, a GPT-5.4. A modell fejlesztései az ügynöki kódolásban, a fogalmi tisztaságban, a tudományos kutatási képességekben és a tudásalapú munka pontosságában is megmutatkoznak — írja a ZDNET.

David Gewirtz, a ZDNET vezető szerkesztője egy 10 pontos tesztfolyamaton futtatta keresztül a GPT-5.5-öt, amely során a modell 93 pontot kapott. A tesztelő szerint a GPT-5.5 „túlbuzgósága” rontja a pontosságot és az utasításkövetést. A modell gyakran olyan feladatokat is elvégzett, amikre nem kérték, például egy hírösszefoglaló készítésekor több forrásból is gyűjtött információt, holott a prompt egyetlen forrást jelölt meg.

A fejlesztési folyamat felgyorsulása

Az OpenAI kiadási üteme drámaian felgyorsult, ami a ZDNET szerint valószínűleg annak köszönhető, hogy az AI-alapú kódolás jelentősen csökkentette a fejlesztési időt. A GPT-5.5 megjelenését nem sokkal előzte meg a ChatGPT Images 2.0 bevezetése, amely a mesterséges intelligenciát képgenerálással ötvözi.

A modell elérhetősége és működése

A GPT-5.5 jelenleg csak fizetős szinteken, így a ChatGPT Plus előfizetők számára érhető el. A tesztek során a Standard Thinking módot használták, amely a modell alapértelmezett gondolkodási szintje. A GPT-5.5 fejlesztése a ChatGPT Images 2.0-nal együtt 2024-re tehető.

Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom