175 százalékkal nőtt a „goblin” említések száma a ChatGPT-ben egy tréninghiba miatt
A GPT-5.1 modellek megjelenése után a válaszokban elszaporodtak a goblinok, gremlinek és más mitikus lények, ami a mesterséges intelligencia tréningjének mélyebb problémáira világít rá.

A „goblin” említések száma 175 százalékkal ugrott meg a GPT-5.1 bevezetése után — írja a The Decoder. Az OpenAI egy furcsa jelenségre figyelt fel: a modellek válaszaikba egyre gyakrabban csempésztek be mitikus lényeket.
A probléma gyökere a ChatGPT „Nerdy” személyiségének tréningjében rejlett. Egy jutalmazási jel, amelyet a jó válaszok megjelölésére szántak, véletlenül a lényekkel kapcsolatos metaforákat kezdte előnyben részesíteni. Bár a „Nerdy” személyiség a válaszok mindössze 2,5 százalékát tette ki, a goblin említések 66,7 százalékáért ez felelt, és egy visszacsatolási hurok a tréning során más módokra is átterjesztette a szokást.
A mitikus buktató
Az OpenAI márciusban kikapcsolta a „Nerdy” személyiséget, eltávolította a hibás jutalmazási jelet, és kiszűrte a lényekkel kapcsolatos kifejezéseket a tréningadatokból. A GPT-5.5-nél azonban még mindig fennállt a probléma, mivel annak tréningje már elkezdődött, mielőtt az OpenAI megtalálta volna az okot.
A szabályozás útvesztője
Megoldásként a cég egy speciális utasítást adott hozzá a Codex kódolóeszközhöz, amely megtiltja a lényekre vonatkozó metaforák használatát. Jakub Pachocki vezető kutató egy ASCII-egyszarvút kért a GPT-5.5-től, de egy goblinra emlékeztető képet kapott, a The Decoder március 15-én jelentette meg a történetet.