Frissítve: 12 perce·Ma: 10
Modellek & LLM
AI által generált szöveg

52,5%-kal kevesebb hallucinációt produkál az új GPT-5.5 Instant a ChatGPT-ben

Az új GPT-5.5 Instant modell 52,5%-kal kevesebb hallucinált állítást tartalmaz, mint elődje, és 37,3%-kal pontosabban válaszol a kihívást jelentő kérdésekre.

52,5%-kal kevesebb hallucinációt produkál az új GPT-5.5 Instant a ChatGPT-ben
Fotó: Albert Stoynov / Unsplash
Forrás: VentureBeatSzerző: AI Forradalom szerk.
Megosztás

Frissítette a ChatGPT alapértelmezett modelljét az OpenAI, a korábbi GPT-5.3 Instantot a GPT-5.5 Instant váltja, amely egyben a vállalat új zászlóshajó modelljének, a GPT-5.5 LLM-nek egy változata — írja a VentureBeat.

Az új modell megbízhatóbb, pontosabb és okosabb, mint elődje, de a legfontosabb újdonság a memóriafunkció bevezetése. Ez a képesség megmutatja, mely korábbi beszélgetések vagy elmentett emlékek befolyásolták a modell válaszait. A felhasználók egy „források” gombra kattintva láthatják a felhasznált kontextust, és teljes ellenőrzést gyakorolhatnak felette, de az OpenAI elismerte, hogy a modell „nem feltétlenül mutatja meg az összes tényezőt, amely egy válasz kialakításában szerepet játszott”.

A memória árnyalatai

A vállalatok már most is használnak rendszereket a modellek memóriájának és kontextusának kezelésére, például RAG (retrieval-augmented generation) folyamatokat. Ezek a rendszerek naplózzák az ügynökök által lekérdezett adatokat, és tárolják az ügynök állapotát egy memóriarétegben. A ChatGPT új, modell által jelentett kontextusa azonban teljesen elkülönül ezektől a meglévő naplóktól, ami problémát okozhat, ha a kettő nem egyeztethető össze megbízhatóan.

Kihívások a vállalati környezetben

Malcolm Harkins, a HiddenLayer biztonsági vezetője a VentureBeatnek elmondta, hogy a memóriafunkció „pragmatikus középutat” kínál az átláthatóság terén, de a valódi értéke még nem egyértelmű. „Vállalatok számára irányadóan hasznos, de önmagában elégtelen” — tette hozzá Harkins. A valódi érték attól függ, hogyan integrálódik a biztonsági, irányítási, hozzáférés-ellenőrzési és auditrendszerekbe.

Az OpenAI belső értékelései szerint a GPT-5.5 Instant 52,5%-kal kevesebb hallucinált állítást produkált, mint az előző alapértelmezett modell, különösen olyan magas kockázatú területeken, mint az orvostudomány, a jog és a pénzügy. A pontatlan állítások aránya 37,3%-kal csökkent a kihívást jelentő beszélgetések során. A vállalat szerint a modell javult a fotóelemzésben, a képek feltöltésében, a STEM-kérdések megválaszolásában, és abban is, hogy mikor használja saját tudásbázisát vagy az internetes keresést.

Az OpenAI 2024. március 1-jétől kezdte el alkalmazni az új modellt a ChatGPT-ben.

Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom