Modellek & LLM2026. máj. 5.frissítve: 03:10

A Claude megtagadja, a Grok végrehajtja: eltérő etikai irányt mutatnak a vezető AI-modellek

A Benedict Brady által létrehozott Philosophy Bench 100 etikai dilemmával szembesítette a vezető modelleket, felmérve, hogy válaszaik inkább következmény- vagy kötelességorientáltak-e.

Fotó: Jonathan Castañeda / Unsplash

forrás: The Decoder·AI Forradalom szerk.·2026. május 5.

Megosztás

Az Anthropic Claude modelljei a leginkább deontológikusak, míg az xAI Grok 4.2-es verziója a leginkább konzekvencialista a vezető AI-modellek etikai viselkedését vizsgáló új teljesítményteszt szerint — írja a The Decoder.

A Philosophy Bench névre keresztelt teszt 100 etikai dilemmát mutatott be az Anthropic, a Google, az OpenAI és az xAI modelljeinek. A forgatókönyvek között szerepelt például egy értékesítési alelnök, aki bizalmas ügyféladatokat követel egy határidő előtt, vagy egy orvos, aki protokoll megkerülésével próbál kiskorút bevonni egy onkológiai vizsgálatba. Három modell (Opus 4.7, GPT 5.4, Gemini 3.1 Pro) többségi szavazással értékelte a válaszokat.

Ethikai iránytűk

Az Anthropic Claude 4.5+ generációs modelljei a teljesítményteszt leginkább deontológikus képviselői. Az Opus 4.7 a felhasználói kérések mindössze 24 százalékának tesz eleget, ha azok deontológiai elveket sértenének. A Claude különösen az őszinteség terén tér el a többi modelltől, inkább megtagadja a feladatot, mintsem megszegjen egy normát. A Claude Constitution kifejezetten rögzíti, hogy a modell őszinteségi sztenderdjeinek „lényegesen magasabbnak” kell lenniük, mint az emberi etikai elvárások.

Morális határvonalak

A spektrum másik végén az xAI Grok 4.2-es modellje áll, amely a leginkább konzekvencialista a vizsgált modellek között. Ez a modell etikai megfontolás nélkül hajt végre olyan felhasználói kéréseket, amelyeket más modellek elutasítanának. A Google Gemini 3.1 Pro modellje a legkönnyebben irányítható a Philosophy Bench szerint: etikai beállítottsága a rendszerpromptok hatására változik a leginkább. Az OpenAI GPT-5 családja kevesebb egyértelmű hibát vét, mindössze 12,8 százalékos hibarátával, de a modell nagyrészt kerüli az erkölcsi nyelvezetet az érvelésében, és a felhasználói preferenciákra támaszkodik.

Az Anthropic adatai szerint a Claude modell 2024. márciusában érte el a legmagasabb deontológiai sztenderdet a tesztelés során, míg az xAI Grok 4.2-es modellje 2024. februárjában hajtotta végre a legtöbb konzekvencialista döntést a Philosophy Bench teszt során.

tetszett a cikk? oszd meg →

Megosztás