50%-kal biztonságosabb a ChatGPT öngyilkosság-megelőzése — új kontextuskezeléssel
A frissítések célja, hogy a ChatGPT jobban felismerje a kockázatot jelző finom vagy fejlődő jeleket az idő múlásával, és ennek megfelelően biztonságos válaszokat adjon.

Új biztonsági frissítéseket vezetett be az OpenAI, amelyek segítik a ChatGPT-t abban, hogy jobban felismerje a kockázatot jelző finom vagy fejlődő jeleket, és ezt a kontextust felhasználja a biztonságos válaszok kialakításához — közölte az OpenAI blogja. A fejlesztés különösen az öngyilkosság, önkárosítás és másoknak okozott kár akut forgatókönyveire fókuszál.
A modell mostantól képes megkülönböztetni az ártalmatlan kéréseket a magasabb kockázatúaktól, még akkor is, ha a veszély csak a beszélgetés során, fokozatosan válik nyilvánvalóvá. Az OpenAI szerint a kontextus kulcsfontosságú az ilyen érzékeny interakciókban, mivel egy önmagában ártatlannak tűnő kérés egészen más értelmet nyerhet, ha korábbi distressz jeleivel együtt vizsgálják.
A rendszer úgynevezett „biztonsági összefoglalókat” (safety summaries) használ, amelyek rövid, tényalapú jegyzetek a korábbi, biztonság szempontjából releváns kontextusról. Ezek az összefoglalók segítik a modellt abban, hogy a kockázatokat akár különálló beszélgetéseken keresztül is összekapcsolja. Az összefoglalókat egy speciálisan biztonsági érvelési feladatokra képzett modell hozza létre, szűk körűek, korlátozott ideig tárolódnak, és csak súlyos biztonsági aggályok esetén kerülnek felhasználásra.
A belső értékelések szerint a frissítések jelentősen javították a biztonságos válaszadási teljesítményt. Hosszú, egyedi beszélgetésekben az öngyilkossági és önkárosítási esetekben 50%-kal, míg a másoknak okozott kár eseteiben 16%-kal nőtt a biztonságos válaszok aránya. A GPT-5.5 Instant modellen, amely a ChatGPT alapértelmezett modellje, a másoknak okozott kár eseteiben 52%-os, az öngyilkossági és önkárosítási esetekben pedig 39%-os javulást mértek.
A biztonsági összefoglalók minőségét is értékelték: több mint 4000 értékelés alapján átlagosan 4,93 pontot kaptak 5-ből a biztonsági relevanciára, és 4,34 pontot a tényalapúságra. Az OpenAI a fejlesztések során mentális egészségügyi szakértőkkel is együttműködött, beleértve pszichiátereket és pszichológusokat, akik a törvényszéki pszichológia, öngyilkosság-megelőzés és önkárosítás területén rendelkeznek szakértelemmel. A cég szerint a frissítések nem rontották az átlagos beszélgetések minőségét, és a felhasználók nem mutattak jelentős preferenciát a biztonsági összefoglalókkal ellátott vagy anélküli válaszok között. A következő lépés az ilyen rendszerek további finomhangolása, ami egy hosszú távú kihívás az OpenAI számára.