Frissítve: 3 órája·Ma: 1
Kutatás
AI által generált szöveg

A "gondolkodó mód" nem változtatja a LLM-ek morális ítéleteit — állítják kutatók

Az azonnali és a "gondolkodó mód" között nem volt szignifikáns különbség az öt vizsgált modell összesített bináris ítéleteiben, de a vitatott esetekben a gondolkodás csökkentette a modellek közötti eltéréseket.

A "gondolkodó mód" nem változtatja a LLM-ek morális ítéleteit — állítják kutatók
Fotó: Deniz Demirci / Unsplash
Forrás: ArXiv AISzerző: AI Forradalom szerk.
Megosztás

Nem változtatja meg jelentősen a nagyméretű nyelvi modellek (LLM) morális ítéleteit az úgynevezett "gondolkodó mód" bekapcsolása — derül ki egy friss kutatásból, amelyet az arXiv kutatói tettek közzé előnyomtatott formában.

A tanulmány öt vezető, gondolkodásra betanított LLM-et vizsgált: a Claude Sonnet 4.6-ot, a GPT 5.5-öt, a Gemini 3 Flash-t, a DeepSeek V3.1-et és a Qwen3.5 397B-t. Összesen 100 morális forgatókönyvön keresztül hasonlították össze az azonnali és a "gondolkodó mód" ítéleteit.

Az összesített bináris ítéletekben a két mód közötti egyezés magas maradt, statisztikailag megkülönböztethetetlen volt (Krippendorff-féle alfa: 0,78 az azonnali, 0,79 a gondolkodó mód esetében). Az eltérések azonban 21 olyan forgatókönyvben koncentrálódtak, ahol az azonnali módú egyezés a véletlenszerűség határán mozgott (alfa = 0,08).

A gondolkodó mód hatása a vitatott esetekre

Ezekben a vitatott esetekben a gondolkodó mód irányítottan csökkentette a modellek közötti nézeteltéréseket, növelve az átlagos páros egyezést 5,4-ről 6,7-re tízből. Az arXiv kutatói szerint a gondolkodó mód három modell esetében csökkentette a demográfiai ítéletek inkonzisztenciáját, és egyetlen modellnél sem növelte azt.

Érdekes módon mind az öt modellcsalád esetében a gondolkodó mód gyakrabban változtatta meg a modellek által megnevezett etikai keretrendszereket, mint magukat a bináris ítéleteket. Ez arra utal, hogy a modellek belső érvelési folyamatai finomodhatnak, még akkor is, ha a végső döntés nem változik.

Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom