Nem általánosítható a hallucináció a LLM-ekben — domain-specifikus a jelenség
A korábbi kutatások által azonosított, a hallucinációkat előrejelző neuronok nem működnek más területeken, ami megnehezíti a jelenség univerzális kezelését.

Az úgynevezett „hallucinációs neuronok” (H-neuronok), amelyek megbízhatóan előrejelzik, mikor fognak a nagyméretű nyelvi modellek (LLM-ek) hamis információkat generálni, úgy tűnik, nem általánosíthatók a különböző tudásterületeken — derül ki egy új, előnyomtatott formában megjelent kutatásból, amelyet a arXiv tett közzé.
A kutatók hat különböző tudásterületen (általános kérdés-válasz, jog, pénzügy, tudomány, morális érvelés és kódsebezhetőség) vizsgálták a H-neuronok transzferálhatóságát, öt nyílt forráskódú, 3 milliárdtól 8 milliárd paraméterig terjedő modell segítségével.
A hallucinációk rejtett terepei
Az eredmények egyértelműen azt mutatták, hogy a H-neuronok nem általánosíthatók a területek között. Az egyik domain H-neuronjain betanított osztályozók 0,783-as AUROC (Area Under the Receiver Operating Characteristic curve) értéket értek el az adott területen belül, de mindössze 0,563-at, amikor egy másik domainre vitték át őket.
A neurális labirintusok titkai
Ez 0,220-as romlást jelentett (p < 0,001), amely a tesztelt összes modellnél konzisztens volt. A kutatás fontos következményekkel jár a LLM-ek megbízhatóságának javítására és a hallucinációk csökkentésére irányuló stratégiákra nézve, például a jogi vagy pénzügyi modellek esetében, a 2024 év folyamán várható további fejlesztésekkel.