Frissítve: 2 órája·Ma: 14
Kutatás
AI által generált szöveg

Személyi asszisztensek adatvédelmi és költségproblémáit oldhatja meg az új LLM-módszer

A felhőalapú modellek eddig érzékeny adatokat is továbbítottak, míg a helyi megoldások megbízhatatlanabbak voltak, most azonban a feladatokat könnyűsúlyú modulokban tanulja meg a rendszer.

Személyi asszisztensek adatvédelmi és költségproblémáit oldhatja meg az új LLM-módszer
Fotó: National Cancer Institute / Unsplash
Forrás: ArXiv AISzerző: AI Forradalom szerk.
Megosztás

A LLM-alapú ügynökök egyre gyakrabban működtetnek böngészőket, fájlokat, kódot és eszközöket, így a személyi asszisztensek természetes célponttá váltak számukra. Ezek az asszisztensek azonban adatvédelmi, költség- és képességbeli feszültséggel küzdenek — írja egy friss tanulmány a arXiv előnyomtatott szerverén.

A felhőalapú modellek jól kezelik a többlépéses munkafolyamatokat, de érzékeny kontextusadatokat is felfednek külső API-k felé. A helyi modellek megőrzik az adatvédelmet, de kevésbé megbízhatóak. Mindkét megközelítés ismétlődő költségeket generál a hosszú utasítások és a növekvő előzmények miatt.

A kutatók a „konstans kontextusú képzés” nevű, „kontextusból súlyokba” keretrendszert javasolják a visszatérő ügynök munkafolyamatokhoz. Ennek lényege, hogy az újrafelhasználható eljárásokat könnyűsúlyú, feladatcsalád-specifikus modulokban tanulja meg a rendszer, miközben a következtetés során csak az aktuális megfigyelésre és egy kompakt állapotblokkra támaszkodik.

Egy determinisztikus nyomkövető hozza létre ezt az állapotblokkot a feladat előrehaladásából, és biztosítja az igazított részcél-jutalmakat. Így minden modul betanítható lépésszintű SFT-vel (Supervised finomhangolás), majd finomhangolható online megerősítéses tanulással (RL).

A módszert több környezetben is tesztelték, mint például az ALFWorld, a WebShop és a SciWorld platformokon. A kutatók szerint ez a megközelítés jelentősen csökkentheti a LLM-alapú személyi asszisztensek működési költségeit és javíthatja az adatvédelmet, miközben megőrzi a képességeket.

A tanulmány az arXiv:2605.05413v1 azonosító alatt érhető el.

Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom