Személyi asszisztensek adatvédelmi és költségproblémáit oldhatja meg az új LLM-módszer
A felhőalapú modellek eddig érzékeny adatokat is továbbítottak, míg a helyi megoldások megbízhatatlanabbak voltak, most azonban a feladatokat könnyűsúlyú modulokban tanulja meg a rendszer.

A LLM-alapú ügynökök egyre gyakrabban működtetnek böngészőket, fájlokat, kódot és eszközöket, így a személyi asszisztensek természetes célponttá váltak számukra. Ezek az asszisztensek azonban adatvédelmi, költség- és képességbeli feszültséggel küzdenek — írja egy friss tanulmány a arXiv előnyomtatott szerverén.
A felhőalapú modellek jól kezelik a többlépéses munkafolyamatokat, de érzékeny kontextusadatokat is felfednek külső API-k felé. A helyi modellek megőrzik az adatvédelmet, de kevésbé megbízhatóak. Mindkét megközelítés ismétlődő költségeket generál a hosszú utasítások és a növekvő előzmények miatt.
A kutatók a „konstans kontextusú képzés” nevű, „kontextusból súlyokba” keretrendszert javasolják a visszatérő ügynök munkafolyamatokhoz. Ennek lényege, hogy az újrafelhasználható eljárásokat könnyűsúlyú, feladatcsalád-specifikus modulokban tanulja meg a rendszer, miközben a következtetés során csak az aktuális megfigyelésre és egy kompakt állapotblokkra támaszkodik.
Egy determinisztikus nyomkövető hozza létre ezt az állapotblokkot a feladat előrehaladásából, és biztosítja az igazított részcél-jutalmakat. Így minden modul betanítható lépésszintű SFT-vel (Supervised finomhangolás), majd finomhangolható online megerősítéses tanulással (RL).
A módszert több környezetben is tesztelték, mint például az ALFWorld, a WebShop és a SciWorld platformokon. A kutatók szerint ez a megközelítés jelentősen csökkentheti a LLM-alapú személyi asszisztensek működési költségeit és javíthatja az adatvédelmet, miközben megőrzi a képességeket.
A tanulmány az arXiv:2605.05413v1 azonosító alatt érhető el.