Kutatás2026. ápr. 25.frissítve: 12:30

Nem általánosítható a hallucináció az LLM-ekben — domain-specifikus a jelenség

A korábbi kutatások által azonosított, a hallucinációkat előrejelző neuronok nem működnek más területeken, ami megnehezíti a jelenség univerzális kezelését.

Fotó: Jose Antonio Rodriguez Davia / Unsplash

forrás: ArXiv NLP·AI Forradalom szerk.·2026. április 25.

Megosztás

Az úgynevezett „hallucinációs neuronok” (H-neuronok), amelyek megbízhatóan előrejelzik, mikor fognak a nagyméretű nyelvi modellek (LLM-ek) hamis információkat generálni, úgy tűnik, nem általánosíthatók a különböző tudásterületeken — derül ki egy új, előnyomtatott formában megjelent kutatásból, amelyet a arXiv tett közzé.

A kutatók hat különböző tudásterületen (általános kérdés-válasz, jog, pénzügy, tudomány, morális érvelés és kódsebezhetőség) vizsgálták a H-neuronok transzferálhatóságát, öt nyílt forráskódú, 3 milliárdtól 8 milliárd paraméterig terjedő modell segítségével.

A hallucinációk rejtett terepei

Az eredmények egyértelműen azt mutatták, hogy a H-neuronok nem általánosíthatók a területek között. Az egyik domain H-neuronjain betanított osztályozók 0,783-as AUROC (Area Under the Receiver Operating Characteristic curve) értéket értek el az adott területen belül, de mindössze 0,563-at, amikor egy másik domainre vitték át őket.

A neurális labirintusok titkai

Ez 0,220-as romlást jelentett (p < 0,001), amely a tesztelt összes modellnél konzisztens volt. A kutatás fontos következményekkel jár az LLM-ek megbízhatóságának javítására és a hallucinációk csökkentésére irányuló stratégiákra nézve, például a jogi vagy pénzügyi modellek esetében, a 2024 év folyamán várható további fejlesztésekkel.

tetszett a cikk? oszd meg →

Megosztás