The Gradient: a ChatGPT és társai felerősítik a nemi előítéleteket

A mesterséges intelligencia modellek, a statisztikai szóbeágyazásoktól a modern, transzformer-alapú rendszerekig, mint a ChatGPT, átveszik a betanításukhoz használt emberi adatokban rejlő előítéleteket — írja az AI Forradalom.

Ezek a torzítások nemcsak a nyelvben, hanem a vizuális felismerő rendszerekben is megjelennek, és súlyos következményekkel járhatnak. A kutatók már évek óta dolgoznak azon, hogy feltárják, értékeljék és mérjék a nemi előítéletek különböző aspektusait az AI-ban.

A szóbeágyazások rejtett sztereotípiái

A nemi torzítások egyik korai és jól dokumentált példája a szóbeágyazásokban jelent meg. A Bolukbasi és társai által 2016-ban publikált kutatás kimutatta, hogy a Google News cikkeken betanított szóbeágyazásokban szexista analógiák léteznek. Például a „férfi : számítógép-programozó” analógiára a „nő : háziasszony” párosítás adódott, ami a betanító adatokban rejlő sztereotípiákat tükrözi.

A kutatók módszert is javasoltak a szóbeágyazások torzításmentesítésére. Egy nemsemleges szavakból álló halmaz (például nő, férfi, lány, fiú, nővér, fivér) segítségével csökkentették a sztereotip analógiákat, miközben megőrizték a helyeseket. Bár ez a módszer a mai, komplexebb transzformer-alapú rendszereknél már nem alkalmazható közvetlenül, úttörő volt abban, hogy matematikai úton számszerűsítette és javasolt megoldást a nemi torzításra.

Az arcfelismerés és a bőrszín

A torzítások nemcsak a nyelvi modellekben, hanem a vizuális rendszerekben is súlyos problémát jelentenek. A Gender Shades projekt (Buolamwini és Gebru, 2018) feltárta, hogy a kereskedelmi arcfelismerő rendszerekben metszésponti nemi és faji torzítások vannak. Ezek a rendszerek sokkal alacsonyabb pontossággal osztályozták a sötétebb bőrű nőket, mint a világosabb bőrű férfiakat, akár 34,7%-os hibaaránnyal is. Ezzel szemben a világosabb bőrű férfiaknál a maximális hibaarány mindössze 0,8% volt.

A kutatás közvetlen hatására a Microsoft és az IBM is felülvizsgálta és bővítette modelljeinek betanító adathalmazaikat, hogy sokszínűbb bőrtónusokat, nemeket és életkorokat tartalmazzanak. Ez a példa is rávilágít arra, hogy a technológiai rendszereknek minden ember életét javítaniuk kell, nem csak bizonyos demográfiai csoportokét.

A torzított beágyazások széles körű alkalmazása a downstream alkalmazásokban, mint például a hangulatelemzés vagy a dokumentumrangsorolás, csak felerősítené ezeket az előítéleteket. A Bolukbasi és társai által 2016-ban javasolt módszer a sztereotip analógiák csökkentésével hozzájárult a tisztább adatokhoz.