Frissítve: 2 órája·Ma: 14
Modellek & LLM
AI által generált szöveg

GPT-5.5: 20 százalékkal magasabb ár az API-n, 86 százalékos hallucináció az OpenAI új modelljében

Az új modell 60 ponttal veri a Claude Opus 4.7 és a Gemini 3.1 Pro Preview riválisokat az Artificial Analysis Intelligence Indexen.

GPT-5.5: 20 százalékkal magasabb ár az API-n, 86 százalékos hallucináció az OpenAI új modelljében
Fotó: Willian Justen de Vasconcellos / Unsplash
Forrás: The DecoderSzerző: AI Forradalom szerk.
Megosztás

Az OpenAI GPT-5.5 modellje 20 százalékkal drágább az API-n keresztül, mint elődje, a GPT-5.4 — írja a The Decoder. Bár a tokenárak nominálisan megduplázódtak, a modell körülbelül 40 százalékkal kevesebb tokent fogyaszt, így a nettó áremelkedés 20 százalékra csökken.

A GPT-5.5 modell a ténybeli pontosság és a hallucinációk szempontjából is érdekes eredményeket mutatott az Artificial Analysis Intelligence Indexen. Az Artificial Analysis AA Omniscience benchmarkján, amely a ténybeli pontosságot jutalmazza és a téves válaszokat bünteti, a GPT-5.5 érte el a legmagasabb, 57 százalékos pontosságot.

Az intelligencia sötét oldala

A modell gyenge pontja továbbra is a magas, 86 százalékos hallucinációs ráta. Az Artificial Analysis AA Omniscience benchmarkján, amely a ténybeli pontosságot jutalmazza és a téves válaszokat bünteti, a GPT-5.5 érte el a legmagasabb, 57 százalékos pontosságot. Ugyanakkor hallucinációs rátája messze meghaladja a Claude Opus 4.7 36 százalékát és a Gemini 3.1 Pro Preview 50 százalékát.

A fejlődés üteme

A GPT-5.4-hez képest elért 14 pontos javulás ezen a teljesítményteszten elsősorban a jobb tényfelidézésből származik, a hallucinációk terén csak szerény előrelépés történt. A GPT-5.5 modell 2024. évben várható további fejlesztése a The Decoder szerint.

Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom