Kutatás2026. ápr. 25.frissítve: 10:50

Új ArXiv kutatás: prompt-alapú módszerrel csökkenthető a generatív AI-modellek torzítása

A felhasználók így maguk választhatják ki a kívánt demográfiai eloszlást, legyen szó egyszerű, egyenletes elosztásról vagy LLM által finomított definíciókról.

Fotó: jevgeni mironov / Unsplash

forrás: ArXiv AI·AI Forradalom szerk.·2026. április 25.

Megosztás

Könnyen hozzáférhetővé tették a generatív AI-t a Stable Diffusion és DALL-E típusú szövegből képet alkotó (T2I) modellek, ám a rendszerek gyakran reprodukálják a társadalmi előítéleteket — állapítja meg egy új ArXiv tanulmány.

A kutatás szerint különösen szembetűnő ez a demográfiai csoportok foglalkozási ábrázolásánál. Az olyan utasítások, mint a „doctor” vagy „CEO” gyakran világosabb bőrű személyeket eredményeznek, míg az alacsonyabb státuszú szerepek, például a „janitor” (takarító) esetében nagyobb a sokféleség, ezzel is erősítve a sztereotípiákat.

A meglévő torzításenyhítő módszerek általában átképzést vagy kurált adathalmazokat igényelnek, ami a legtöbb felhasználó számára elérhetetlenné teszi őket. A most javasolt könnyű, következtetési idejű keretrendszer azonban prompt-szintű beavatkozással enyhíti a reprezentációs torzítást anélkül, hogy az alapul szolgáló modellt módosítaná.

A megközelítés nem egyetlen „fairness” definíciót feltételez, hanem lehetővé teszi a felhasználók számára, hogy többféle méltányossági specifikáció közül válasszanak. Ezek az egyszerű, egyenletes elosztástól a nagyméretű nyelvi modellek (LLM) által informált, összetettebb definíciókig terjedhetnek, így a felhasználók maguk dönthetnek a kívánt demográfiai reprezentációról a generált képeken.

tetszett a cikk? oszd meg →

Megosztás