A számítógépes modellek viselkedését is alakítja az emberi érzelem
Az E-STEER keretrendszerrel az emberi érzelmi állapotok szabályozhatóvá válnak a számítógépes modellekben, és hatással vannak az objektív érvelésre, a szubjektív generálásra, a biztonságra és a többlé

A kutatók a E-STEER keretrendszerrel bemutatták, hogyan lehet az érzelmeket közvetlenül beágyazni a nagy nyelvi modellek (LLM) rejtett állapotába. A módszer egy struktúrált, szabályozható változót hoz létre, amelyet a modell belső folyamatába integrálnak, így az érzelem hatása a generált szövegre és a döntéshozatalra egyértelműen mérhető.
Az E-STEER célja, hogy az érzelmi állapotokat nem csupán stílusjegyként, hanem mechanikai tényezőként kezelje a feladatfeldolgozás során. A kísérletek során a kutatók megfigyelték, hogy a modellek objektív érvelése és szubjektív generálása jelentősen változik az érzelmi állapotok függvényében. Például a „düh” állapotban a modell inkább logikai hibákat követ, míg a „megelégedettség” hatására a válaszok koherenssé válnak.
Technikailag az E-STEER egy rejtett rétegben helyezi el az érzelmi változót, majd a finomhangolás során a modell tanul, hogy hogyan reagáljon különböző érzelmi kódekre. A megfigyelések szerint a modellekben nem lineáris, hanem nem-monoton kapcsolat mutatkozik az érzelmek és a viselkedés között, ami összhangban áll a pszichológiai elméletekkel.
A kutatás eredményei szerint bizonyos érzelmek, mint például a „bizalom” vagy a „szeretet”, nem csak a modellek teljesítményét erősítik, hanem a biztonságot is javítják, csökkentve a félrevezető vagy káros kimenetek számát. Ez jelzi, hogy az érzelmi beágyazás potenciálisan új szintre emelheti a LLM-ek megbízhatóságát.
A következő lépésben a csapat a E-STEER keretrendszer skálázhatóságát vizsgálja, hogy megállapítsa, mennyire hatékonyan alkalmazható többnyelvű és multimodális modellekben. A cél, hogy a következő kiadásban konkrét, mérhető teljesítménynövekedést mutassanak a többnyelvű szövegértésben.