Automatizálja az AI-ügynökök finomhangolását az új keretrendszer
A rendszer az utasítások, eszközök és logikák tervezését is önállóan végzi, ami jelentősen felgyorsíthatja a domain-specifikus munkafolyamatok bevezetését.

Egy új, kétlépcsős keretrendszer automatizálja az AI-ügynökök finomhangolását, kiküszöbölve a szakértői beavatkozás szükségességét a komplex feladatoknál — írja az ArXiv AI.
A kutatók szerint az AI-ügynökök egyre gyakrabban dolgoznak összetett, domain-specifikus munkafolyamatokon, például vállalati webes alkalmazások navigálásán, több lépéses kutatási folyamatok koordinálásán, kódellenőrzésen vagy ügyfélszolgálati feladatokon.
A Harness Evolution Loop
A bemutatott kétlépcsős keretrendszer, a Harness Evolution Loop, ezt a folyamatot automatizálja. Az első szinten egy Worker Agent végzi el a feladatot, egy Evaluator Agent diagnosztizálja a hibákat és értékeli a teljesítményt, majd egy Evolution Agent módosítja a „harness”-t a diagnosztizált hibaminták alapján.
Ez a módosítás kiterjedhet az eszközimplementációkra, a rendszerpromptokra, az orkesztrációs logikára vagy a modellkonfigurációra.
A hibaminták azonosítása
A rendszer képes azonosítani a visszatérő hibamintákat, például a helytelen eszközhasználatot, az indoklási hurkokat vagy a környezeti állapot félreértelmezését. A történelmi kontextus megakadályozza, hogy az Evolution Agent megismételje a sikertelen stratégiákat, és lehetővé teszi, hogy a korábbi tapasztalatokra építsen. A kutatás szerint a rendszer 2024-ben kerül majd bemutatásra az ArXiv AI oldalán.