Frissítve: 17 perce·Ma: 9
Kutatás
AI által generált szöveg

Új ArXiv kutatás: prompt-alapú módszerrel csökkenthető a generatív AI-modellek torzítása

A felhasználók így maguk választhatják ki a kívánt demográfiai eloszlást, legyen szó egyszerű, egyenletes elosztásról vagy LLM által finomított definíciókról.

Új ArXiv kutatás: prompt-alapú módszerrel csökkenthető a generatív AI-modellek torzítása
Fotó: jevgeni mironov / Unsplash
Forrás: ArXiv AISzerző: AI Forradalom szerk.
Megosztás

Könnyen hozzáférhetővé tették a generatív AI-t a Stable Diffusion és DALL-E típusú szövegből képet alkotó (T2I) modellek, ám a rendszerek gyakran reprodukálják a társadalmi előítéleteket — állapítja meg egy új ArXiv tanulmány.

A kutatás szerint különösen szembetűnő ez a demográfiai csoportok foglalkozási ábrázolásánál. Az olyan utasítások, mint a „doctor” vagy „CEO” gyakran világosabb bőrű személyeket eredményeznek, míg az alacsonyabb státuszú szerepek, például a „janitor” (takarító) esetében nagyobb a sokféleség, ezzel is erősítve a sztereotípiákat.

A meglévő torzításenyhítő módszerek általában átképzést vagy kurált adathalmazokat igényelnek, ami a legtöbb felhasználó számára elérhetetlenné teszi őket. A most javasolt könnyű, következtetési idejű keretrendszer azonban prompt-szintű beavatkozással enyhíti a reprezentációs torzítást anélkül, hogy az alapul szolgáló modellt módosítaná.

A megközelítés nem egyetlen „fairness” definíciót feltételez, hanem lehetővé teszi a felhasználók számára, hogy többféle méltányossági specifikáció közül válasszanak. Ezek az egyszerű, egyenletes elosztástól a nagyméretű nyelvi modellek (LLM) által informált, összetettebb definíciókig terjedhetnek, így a felhasználók maguk dönthetnek a kívánt demográfiai reprezentációról a generált képeken.

Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom