Automatizálja az AI-ügynökök finomhangolását az új keretrendszer

Egy új, kétlépcsős keretrendszer automatizálja az AI-ügynökök finomhangolását, kiküszöbölve a szakértői beavatkozás szükségességét a komplex feladatoknál — írja az ArXiv AI.

A kutatók szerint az AI-ügynökök egyre gyakrabban dolgoznak összetett, domain-specifikus munkafolyamatokon, például vállalati webes alkalmazások navigálásán, több lépéses kutatási folyamatok koordinálásán, kódellenőrzésen vagy ügyfélszolgálati feladatokon.

A Harness Evolution Loop

A bemutatott kétlépcsős keretrendszer, a Harness Evolution Loop, ezt a folyamatot automatizálja. Az első szinten egy Worker Agent végzi el a feladatot, egy Evaluator Agent diagnosztizálja a hibákat és értékeli a teljesítményt, majd egy Evolution Agent módosítja a „harness”-t a diagnosztizált hibaminták alapján.

Ez a módosítás kiterjedhet az eszközimplementációkra, a rendszerpromptokra, az orkesztrációs logikára vagy a modellkonfigurációra.

A hibaminták azonosítása

A rendszer képes azonosítani a visszatérő hibamintákat, például a helytelen eszközhasználatot, az indoklási hurkokat vagy a környezeti állapot félreértelmezését. A történelmi kontextus megakadályozza, hogy az Evolution Agent megismételje a sikertelen stratégiákat, és lehetővé teszi, hogy a korábbi tapasztalatokra építsen. A kutatás szerint a rendszer 2024-ben kerül majd bemutatásra az ArXiv AI oldalán.