Új ArXiv kutatás: prompt-alapú módszerrel csökkenthető a generatív AI-modellek torzítása
A felhasználók így maguk választhatják ki a kívánt demográfiai eloszlást, legyen szó egyszerű, egyenletes elosztásról vagy LLM által finomított definíciókról.

Könnyen hozzáférhetővé tették a generatív AI-t a Stable Diffusion és DALL-E típusú szövegből képet alkotó (T2I) modellek, ám a rendszerek gyakran reprodukálják a társadalmi előítéleteket — állapítja meg egy új ArXiv tanulmány.
A kutatás szerint különösen szembetűnő ez a demográfiai csoportok foglalkozási ábrázolásánál. Az olyan utasítások, mint a „doctor” vagy „CEO” gyakran világosabb bőrű személyeket eredményeznek, míg az alacsonyabb státuszú szerepek, például a „janitor” (takarító) esetében nagyobb a sokféleség, ezzel is erősítve a sztereotípiákat.
A meglévő torzításenyhítő módszerek általában átképzést vagy kurált adathalmazokat igényelnek, ami a legtöbb felhasználó számára elérhetetlenné teszi őket. A most javasolt könnyű, következtetési idejű keretrendszer azonban prompt-szintű beavatkozással enyhíti a reprezentációs torzítást anélkül, hogy az alapul szolgáló modellt módosítaná.
A megközelítés nem egyetlen „fairness” definíciót feltételez, hanem lehetővé teszi a felhasználók számára, hogy többféle méltányossági specifikáció közül válasszanak. Ezek az egyszerű, egyenletes elosztástól a nagyméretű nyelvi modellek (LLM) által informált, összetettebb definíciókig terjedhetnek, így a felhasználók maguk dönthetnek a kívánt demográfiai reprezentációról a generált képeken.