WebXSkill: Új AI keretrendszer tanítja meg az ügynököket a webes feladatokra
A WebXSkill kétfázisú képzési rendszerrel tanítja meg az LLM-ügynököket bonyolult böngészőfeladatokra, és felülmúlja a korábbi megközelítéseket hosszú horizontú feladatokon.

Új keretrendszert mutatott be az ArXiv AI, amely WebXSkill néven segíti az autonóm webes ügynököket a komplex böngészőfeladatok elsajátításában — írja a kutatási portál.
A WebXSkill célja, hogy áthidalja a szöveges és kódalapú skillek közötti szakadékot. Eddig a szöveges útmutatók nem voltak közvetlenül végrehajthatók, a kódalapú skillek pedig átláthatatlanok voltak az ügynökök számára, ami akadályozta a hibakezelést és az adaptációt.
A keretrendszer végrehajtható skilleket kínál, amelyek egy paraméterezett akcióprogramot párosítanak lépésenkénti természetes nyelvi útmutatással. Ez lehetővé teszi a közvetlen végrehajtást és az ügynök által vezérelt adaptációt is.
A WebXSkill három fázisban működik: először kinyeri az újrahasználható akciósorozatokat a szintetikus ügynök-trajektóriákból, majd ezeket paraméterezett skillekké absztrahálja. Ezt követően a skilleket URL-alapú gráfba rendezi a kontextusfüggő hozzáférés érdekében.