Az Anthropic modellje 171 érzelmi fogalmat tud felismerni
A kutatók 171 érzelmi fogalommal tesztelték a Claude modellt, és azonosítottak olyan mintákat, amelyek az érzelmi reakciókat jellemzik.

Anthropic kutatói 171 érzelmi fogalommal tesztelték a Claude Sonnet 4.5 modellt, és rögzítették, hogy a modell belső aktivációs mintái – „emotion vectors” – konzisztensen megjelennek, amikor érzelmi szövegeket dolgoz fel. A listában szerepelnek például a „happy”, „afraid”, „brooding” és „proud” kifejezések, melyeket a modell rövid történetekben használt fel, hogy a karakterek konkrét érzelmi állapotait ábrázolja.
Az érzelmi reprezentációk fontosak, mert a modelleknek meg kell jósolniuk, hogyan reagál a felhasználó – egy frusztrált ügyfél másképp fogalmaz, mint egy elégedett. A Claude számára ez azt jelenti, hogy a válaszok szövege és stílusa is a belső érzelemállapotra épül, így a modell valójában „karakterként” viselkedik.
Az elemzés során az Anthropic mérte a modell neuronális aktivációit, és megállapította, hogy minden érzelemhez egyedi, ismétlődő vektor jön létre. Ezek a vektorok lehetővé teszik a model számára, hogy különböző érzelmi szövegeket generáljon, miközben megtartja a kontextuális koherenciát.
Az eredmények szerint a Claude képes a 171 érzelem közül minden egyesére finomhangolt válaszokat adni, ami előnyt jelent a felhasználói élmény szempontjából. A modellel való interakció során a felhasználó érezheti, hogy az AI valóban reagál az érzelmi jelzésekre.
Mi következik? A kutatók most arra fókuszálnak, hogy a megtalált érzelemvektorokat beépítsék a modellek finomhangolási folyamatába, hogy még pontosabban tudják előre jelezni a felhasználói viselkedést.