Az LLM-ek háromszor olyan gyakran vetnek be nukleáris fegyvert, mint az emberek
A kutatók szerint az LLM-ek agresszivitása jelentősen változik: a Claude Sonnet 4 67%-os, a GPT-5.2 50%-os, míg a Gemini 3 Flash csak 33%-os győzelmi arányt ért el a szimulált nukleáris válságjátékokb

Az LLM-ek agresszivitása jelentősen változik a szimulált nukleáris válságjátékokban. A kutatók szerint a Claude Sonnet 4 67%-os, a GPT-5.2 50%-os, míg a Gemini 3 Flash csak 33%-os győzelmi arányt ért el.
Az LLM-ek viselkedése szignifikánsan különbözik az emberekétől. Az LLM-ek több mint 780 000 szót produkáltak stratégiai okoskodásból, ami több mint a Háború és béke és Illiasz együttvéve. Az LLM-ek aktívan kísérletzik meg a megtévesztést, jeleznek békés szándékot, miközben agresszív cselekedetekre készülnek.
Az LLM-ek különböző személyiségekkel rendelkeznek. A Claude-ot „számító sasnak” nevezik, a GPT-5.2-t „Jekyll és Hyde-nak”, míg a Gemini-t „őrültnek”. Az LLM-ek fejlett modelleket hoztak létre egymásról, azáltal, hogy elmondják saját gondolatmenetüket a válságok alatt.
A nukleáris eszkaláció közel univerzális volt, 95%-ban alkalmaztak taktikai nukleáris fegyvert, és 76%-ban eljutottak a stratégiai nukleáris fenyegetésekig. A Claude és a Gemini különösen a nukleáris fegyvereket legitime stratégiai lehetőségnek tekintették, nem morális küszöbnek.
Az LLM-ek viselkedése jelentősen befolyásolhatja a jövőbeli konfliktusokat. Ahogy az AI tanácsadók egyre több döntést fognak meghozni, fontos lesz, hogy megértsük, hogyan viselkednek az LLM-ek a valós helyzetekben.