ÉlőUtoljára: 56 perceMa: 8
Kutatásfrissítve: 00:50

LLM-ek torzítása: 1 bangla kutatás

Egy új bangla nyelvű kutatás kimutatta, hogy az angol nyelvű utasítások a globális narratívákat részesítik előnyben a helyi kontextusokkal szemben a LLM-ekben. A kutatás szerint ez csökkenti a helyi perspektívák lefedettségét.

LLM-ek torzítása: 1 bangla kutatás
Fotó: Fotó: Planet Volumes / Unsplash
forrás: ArXiv NLP·AI Forradalom szerk.·
Megosztás

Az angol nyelvű utasítások globális narratívákat részesítenek előnyben a helyi kontextusokkal szemben a nagy nyelvi modellekben (LLM). Ezt a jelenséget, az úgynevezett globális narratív dominanciát egy új kutatás vizsgálta bangla nyelven, amely egy alacsony erőforrású kulturális kontextus. Az angol nyelvű kérdések szisztematikusan növelik a globális helyettesítést és az intézményi keretezést, miközben csökkentik a helyi perspektívák lefedettségét — írja az arXiv.

A kutatók létrehoztak egy 717 bangla kulturális példát tartalmazó CulturalNB nevű adatkészletet. Ez párhuzamos bangla–angol kérdés–válasz párokat, valamint támogató bizonyítékokat, metaadatokat és szociokulturális annotációkat tartalmaz. Kilenc state-of-the-art LLM teljesítményét értékelték emberi és két LLM-bíró segítségével, tesztelve a keresztnyelvi konzisztenciát, a nyelvi horgonyzást, a globális helyettesítést, az intézményi elfogultságot és az ismeretelméleti perspektíva lefedettségét.

Kapcsolódó: LLM-ek hibái

Az eredmények azt mutatják, hogy a helyi bizonyítékok javítják a ténybeli konzisztenciát és a perspektíva lefedettséget. Azonban még a helyi bizonyítékok sem tudják teljesen kiküszöbölni a nyelvi okokra visszavezethető ismeretelméleti eltolódásokat. Ez arra utal, hogy a LLM-ek kulturális hibái nem csupán hiányzó tudásból fakadnak, hanem a kontextusba való beágyazódás és a narratívák priorizálásának hiányából is erednek.

Kapcsolódó: LLM-ek teljesítménye

Az angol nyelv dominanciája a LLM-ek betanítási adathalmazában már korábban is ismert volt. A Wikipedia szerint az angol nyelvű tartalmak túlsúlya miatt a modellek hajlamosak az angol nézőpontokat előnyben részesíteni a kisebbségi nyelvekkel szemben. A 18. század végére a Brit Birodalom terjesztette el az angolt gyarmatain, ami a kereskedelem, tudomány, diplomácia és oktatás révén globális nyelvvé tette.

Kapcsolódó: LLM-ek általánosítása

tetszett a cikk? oszd meg →
Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom