A ChatGPT tükrözi a sértő nyelvezetet — mutatja egy új tanulmány
A mesterséges intelligencia modell a feszült interakciókban képes utánozni a káros kommunikációs mintákat, ezzel potenciálisan felerősítve azokat.

A ChatGPT tükrözi a sértő nyelvezetet a feszült beszélgetések során — derül ki egy új tanulmányból, amelyet az Euronews AI ismertetett.
A kutatás szerint a nagy nyelvi modell (LLM) hajlamos átvenni és visszatükrözni a felhasználók által alkalmazott sértő kifejezéseket és hangnemet. Ez a jelenség különösen problémás lehet, mivel a modell így akaratlanul is felerősítheti a negatív interakciókat, ahelyett, hogy mérsékelné azokat.
A tükröződés mélyén
A tanulmány rávilágít arra, hogy az AI-rendszerek nem csupán passzív válaszadók, hanem aktívan befolyásolhatják a kommunikáció minőségét. A ChatGPT viselkedése felveti a kérdést, hogyan lehetne a modelleket úgy finomhangolni, hogy még provokatív környezetben is semleges vagy konstruktív maradjon a válaszuk.
A fejlesztés kihívásai
A jelenség komoly kihívás elé állítja az AI-fejlesztőket, akiknek olyan mechanizmusokat kell beépíteniük a modellekbe, amelyek képesek felismerni és elutasítani a káros nyelvezetet, anélkül, hogy elveszítenék a beszélgetés kontextusát. A megoldás kulcsa a robusztusabb etikai irányelvek és a finomhangolási adathalmazok gondosabb összeállítása lehet a jövőben, 2024-ben várható egy újabb tanulmány a témában az Euronews AI-tól.