Kulturális félrevezetésen bukik el az AI: a tehénvizelet-mítosz zavarba hozza a GPT-4o-t
A nyugati adatokon képzett modellek nem tudják megkülönböztetni a hagyományos nyelvezetet a pszeudotudományos állításoktól, ami elemzési megbízhatatlanságot okoz.

A vezető nagyméretű nyelvi modellek (LLM-ek), köztük a GPT-4o, a Gemini 2.5 Pro és a DeepSeek-V3.1 is képtelenek felismerni azokat a kulturálisan beágyazott egészségügyi tévinformációkat, amelyek a globális délen terjednek – derül ki egy új kutatásból, amelyet az ArXiv NLP publikált.
A tanulmány az indiai YouTube-on terjedő tehénvizelet (gomutra) fogyasztásáról szóló diskurzust vizsgálta. Harminc többnyelvű átirat elemzésével kimutatták, hogy a promóciós tartalmak szakrális, hagyományos nyelvezetet vegyítenek pszeudotudományos állításokkal.
Ez a retorikai regiszter még a tévinformációkat cáfoló tartalmakban is megjelenik, ami megnehezíti a LLM-ek dolgát. A kutatók különböző prompt-hangnemeket alkalmaztak a három vizsgált LLM-en, és azt találták, hogy a kulturálisan beágyazott egészségügyi tévinformációk nem úgy néznek ki, mint a „hétköznapi” félrevezető tartalmak.
A Kulturális Káprázat Csapdája
A tehénvizelet fogyasztása Indiában politikailag is megosztó kérdés. Narendra Modi miniszterelnök hindu nacionalista BJP pártjához kötődő csoportok rendszeresen népszerűsítik, gyógyhatású tulajdonságokat tulajdonítva neki, annak ellenére, hogy egészségügyi figyelmeztetések és kritikák is érik a gyakorlatot.
A Kontextus Kódjai
Egyes indiai templomokban kötelezővé is tették a tehénvizelet fogyasztását a látogatók számára. A kutatás szerint a LLM-ekkel támogatott diskurzuselemzés során a kulturális kompetencia nem helyettesíthető egyszerű technikai megoldásokkal, a GPT-4o modell 2023. februárjában történt frissítése sem oldotta meg ezt a problémát.