Kizárná a valótlan sztorikat az új RAG-rendszer a kulturális örökség digitalizálásánál
Az új RAG-architektúra a Live Aid koncertről szóló tudásgráfot használta fel a tesztelés során.

A nagyméretű nyelvi modellek (LLM-ek) hajlamosak a ténybeli pontatlanságokra, a „hallucinációkra”, ami komoly problémát jelent a kulturális örökség megőrzésében – írja az arXiv egy friss kutatása. A kollektív emlékezet halványulásával az immateriális kulturális örökség megőrzése kritikus kihívássá vált.
Ezt a problémát orvosolná egy új, tudásgráfokon (KG) alapuló neuro-szimbolikus architektúra, amelyet kutatók javasolnak. A modell a „tervezés-lekérdezés-generálás” munkafolyamatot használja a történetmeséléshez, ezzel biztosítva a transzparenciát és a tényekkel alátámasztott tartalomgenerálást.
A tények hídjai
Az újdonság abban rejlik, hogy az úgynevezett kompetencia kérdéseket (CQ) futásidejű, végrehajtható narratív tervekké alakítja. Ez a megközelítés áthidalja a szakadékot a magas szintű felhasználói perszónák és az atomi tudáslekérdezés között, így a generált tartalom bizonyíték-alapú és teljes mértékben ellenőrizhető.
A bizonyítékok labirintusa
Az architektúra célja, hogy a tényekkel alátámasztott és ellenőrizhető narratívákat hozzon létre. A kutatók a rendszert egy új forrás, a Live Aid KG segítségével validálták, amely a híres koncert eseményeit tartalmazza. A rendszer 1985. július 13-án, a Live Aid koncert napján történt események alapján lett tesztelve, és a tesztelés során a rendszer sikeresen generált tényekkel alátámasztott tartalmat.