ÉlőUtoljára: 23 perceMa: 5
Eszközökfrissítve: 14:50

Új Python réteg szűri a LLM-hallucinációkat — megbízhatóbbá teszi a válaszokat

A hagyományos értékelési módszerek nem skálázhatók, és nem képesek kiszűrni a magabiztos, de hibás válaszokat, ami komoly problémát jelent a termelési rendszerekben.

Új Python réteg szűri a LLM-hallucinációkat — megbízhatóbbá teszi a válaszokat
Fotó: Fotó: Markus Spiske / Unsplash
forrás: Towards Data Science·AI Forradalom szerk.·
Megosztás

A legtöbb nagyméretű nyelvi modell (LLM) értékelési rendszere túlságosan szubjektív pontozásra és emberi ítélkezésre támaszkodik, ami skálázáskor megbukik — írja Emmimal P Alexander a saját blogján. A valódi probléma nem az, hogy a modellek hallucinálnak, hanem az, hogy a jelenlegi rendszerek nem képesek elkapni a magabiztos, de finoman hibás válaszokat.

Alexander egy új értékelőréteget épített, amely a hűséget két jelre bontja: attribúcióra és specificitásra. Magas specificitás és alacsony attribúció együttesen jelzi a hallucinációt. Egyetlen pontszám sosem veszi észre ezt a kombinációt, ami például egy 0.525-ös pontszámnál, 0.5-ös átlépési küszöb mellett, könnyen átcsúszhat.

A hallucinációk fátyla

Ez a rendszer döntéshozó motorként működik a LLM kimenete és a felhasználó között. Eldönti, hogy a választ ki kell-e szolgálni, újra kell-e próbálni, vagy teljesen újra kell-e generálni. Különösen hasznos RAG (Retrieval-Augmented Generation) rendszerek és többfordulós chatbotok esetében, ahol a téves válaszok könnyen bejuthatnak, és a válaszokat idővel ellenőrizni kell.

A fejlesztés nyitott kapui

A fejlesztés teljes Python kóddal elérhető Emmimal P Alexander GitHub-tárhelyén, a Emmimal/llm-eval-layer címen, ahol 2024. március 15-ig 512 alkalommal töltötték le.

tetszett a cikk? oszd meg →
Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom