Frissítve: 1 órája·Ma: 15
Kutatás
AI által generált szöveg

Nem általánosítható a hallucináció a LLM-ekben — domain-specifikus a jelenség

A korábbi kutatások által azonosított, a hallucinációkat előrejelző neuronok nem működnek más területeken, ami megnehezíti a jelenség univerzális kezelését.

Nem általánosítható a hallucináció a LLM-ekben — domain-specifikus a jelenség
Fotó: Jose Antonio Rodriguez Davia / Unsplash
Forrás: ArXiv NLPSzerző: AI Forradalom szerk.
Megosztás

Az úgynevezett „hallucinációs neuronok” (H-neuronok), amelyek megbízhatóan előrejelzik, mikor fognak a nagyméretű nyelvi modellek (LLM-ek) hamis információkat generálni, úgy tűnik, nem általánosíthatók a különböző tudásterületeken — derül ki egy új, előnyomtatott formában megjelent kutatásból, amelyet a arXiv tett közzé.

A kutatók hat különböző tudásterületen (általános kérdés-válasz, jog, pénzügy, tudomány, morális érvelés és kódsebezhetőség) vizsgálták a H-neuronok transzferálhatóságát, öt nyílt forráskódú, 3 milliárdtól 8 milliárd paraméterig terjedő modell segítségével.

A hallucinációk rejtett terepei

Az eredmények egyértelműen azt mutatták, hogy a H-neuronok nem általánosíthatók a területek között. Az egyik domain H-neuronjain betanított osztályozók 0,783-as AUROC (Area Under the Receiver Operating Characteristic curve) értéket értek el az adott területen belül, de mindössze 0,563-at, amikor egy másik domainre vitték át őket.

A neurális labirintusok titkai

Ez 0,220-as romlást jelentett (p < 0,001), amely a tesztelt összes modellnél konzisztens volt. A kutatás fontos következményekkel jár a LLM-ek megbízhatóságának javítására és a hallucinációk csökkentésére irányuló stratégiákra nézve, például a jogi vagy pénzügyi modellek esetében, a 2024 év folyamán várható további fejlesztésekkel.

Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom