Frissítve: 15 perce·Ma: 49
Modellek & LLM
AI által generált szöveg

A számítógépes modellek viselkedését is alakítja az emberi érzelem

Az E-STEER keretrendszerrel az emberi érzelmi állapotok szabályozhatóvá válnak a számítógépes modellekben, és hatással vannak az objektív érvelésre, a szubjektív generálásra, a biztonságra és a többlé

A számítógépes modellek viselkedését is alakítja az emberi érzelem
Fotó: Nubelson Fernandes / Unsplash
Forrás: ArXiv AISzerző: AI Forradalom szerk.
Megosztás

A kutatók a E-STEER keretrendszerrel bemutatták, hogyan lehet az érzelmeket közvetlenül beágyazni a nagy nyelvi modellek (LLM) rejtett állapotába. A módszer egy struktúrált, szabályozható változót hoz létre, amelyet a modell belső folyamatába integrálnak, így az érzelem hatása a generált szövegre és a döntéshozatalra egyértelműen mérhető.

Az E-STEER célja, hogy az érzelmi állapotokat nem csupán stílusjegyként, hanem mechanikai tényezőként kezelje a feladatfeldolgozás során. A kísérletek során a kutatók megfigyelték, hogy a modellek objektív érvelése és szubjektív generálása jelentősen változik az érzelmi állapotok függvényében. Például a „düh” állapotban a modell inkább logikai hibákat követ, míg a „megelégedettség” hatására a válaszok koherenssé válnak.

Technikailag az E-STEER egy rejtett rétegben helyezi el az érzelmi változót, majd a finomhangolás során a modell tanul, hogy hogyan reagáljon különböző érzelmi kódekre. A megfigyelések szerint a modellekben nem lineáris, hanem nem-monoton kapcsolat mutatkozik az érzelmek és a viselkedés között, ami összhangban áll a pszichológiai elméletekkel.

A kutatás eredményei szerint bizonyos érzelmek, mint például a „bizalom” vagy a „szeretet”, nem csak a modellek teljesítményét erősítik, hanem a biztonságot is javítják, csökkentve a félrevezető vagy káros kimenetek számát. Ez jelzi, hogy az érzelmi beágyazás potenciálisan új szintre emelheti a LLM-ek megbízhatóságát.

A következő lépésben a csapat a E-STEER keretrendszer skálázhatóságát vizsgálja, hogy megállapítsa, mennyire hatékonyan alkalmazható többnyelvű és multimodális modellekben. A cél, hogy a következő kiadásban konkrét, mérhető teljesítménynövekedést mutassanak a többnyelvű szövegértésben.

Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom