ÉlőUtoljára: 17 perceMa: 4
Kutatásfrissítve: 09:50

Új keretrendszer 300 szituációval térképezi a LLM-ek kulturális értékeit

A preprint szerzői egy olyan keretrendszert mutatnak be, amely a World Values Survey helyett 300 szituációs dilemmát alkalmaz a LLM-ek rejtett kulturális dimenzióinak feltérképezésére.

Új keretrendszer 300 szituációval térképezi a LLM-ek kulturális értékeit
Fotó: Fotó: Andrew Stutesman / Unsplash
forrás: ArXiv NLP·AI Forradalom szerk.·
Megosztás

Homogenizált kulturális nézeteket tükröznek a LLM-ek — írja az arXiv.

A hagyományos közvetlen kérdezés a World Values Survey (WVS) során gyakran csak semleges vagy biztonsági okokból megtagadott válaszokat eredményez, mert a modellek nem tudják elérni a rejtett kulturális mélységet.

Kulturális mélységek feltárása

Az új keretrendszer a felületet a felületes kérdések helyett szituációs viselkedésvizsgálatra cseréli, és 300 helyzetből származó token‑valószínűségeket von ki, hogy feltérképezze a modellek latens kulturális koordinátáit.

Modellaktivációk irányítása

Az aktivációs irányítás (activation steering) technikával a kutatók a modell előrehaladó lépése során módosítják a belső aktivációkat, anélkül hogy újra betanítanák a rendszert.

Úgy tűnik, hogy jelentős változatosságot találtak a különböző LLM-ek alkalmazkodóképességében, és felfedezték a latent entanglement jelenséget, amelyben egy kulturális dimenzió mentén végzett beavatkozás hatással van másokra.

A kutatók a vizsgálat során az arXiv szerint 2024. március 15-én tették közzé a tanulmányt.

tetszett a cikk? oszd meg →
Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom