A "gondolkodó mód" nem változtatja a LLM-ek morális ítéleteit — állítják kutatók

Az azonnali és a "gondolkodó mód" között nem volt szignifikáns különbség az öt vizsgált modell összesített bináris ítéleteiben, de a vitatott esetekben a gondolkodás csökkentette a modellek közötti eltéréseket.

Fotó: Deniz Demirci / Unsplash

Forrás: ArXiv AI•Szerző: AI Forradalom szerk.•2026. május 7.

Megosztás

Nem változtatja meg jelentősen a nagyméretű nyelvi modellek (LLM) morális ítéleteit az úgynevezett "gondolkodó mód" bekapcsolása — derül ki egy friss kutatásból, amelyet az arXiv kutatói tettek közzé előnyomtatott formában.

A tanulmány öt vezető, gondolkodásra betanított LLM-et vizsgált: a Claude Sonnet 4.6-ot, a GPT 5.5-öt, a Gemini 3 Flash-t, a DeepSeek V3.1-et és a Qwen3.5 397B-t. Összesen 100 morális forgatókönyvön keresztül hasonlították össze az azonnali és a "gondolkodó mód" ítéleteit.

Az összesített bináris ítéletekben a két mód közötti egyezés magas maradt, statisztikailag megkülönböztethetetlen volt (Krippendorff-féle alfa: 0,78 az azonnali, 0,79 a gondolkodó mód esetében). Az eltérések azonban 21 olyan forgatókönyvben koncentrálódtak, ahol az azonnali módú egyezés a véletlenszerűség határán mozgott (alfa = 0,08).

A gondolkodó mód hatása a vitatott esetekre

Ezekben a vitatott esetekben a gondolkodó mód irányítottan csökkentette a modellek közötti nézeteltéréseket, növelve az átlagos páros egyezést 5,4-ről 6,7-re tízből. Az arXiv kutatói szerint a gondolkodó mód három modell esetében csökkentette a demográfiai ítéletek inkonzisztenciáját, és egyetlen modellnél sem növelte azt.

Érdekes módon mind az öt modellcsalád esetében a gondolkodó mód gyakrabban változtatta meg a modellek által megnevezett etikai keretrendszereket, mint magukat a bináris ítéleteket. Ez arra utal, hogy a modellek belső érvelési folyamatai finomodhatnak, még akkor is, ha a végső döntés nem változik.