Folyamatosan tanul a Solvita: új keretrendszerrel oldja meg a LLM-ek programozási kihívásait
A Solvita négy specializált ágenssel — Planner, Solver, Oracle és Hacker — dolgozik, mindegyikhez egy betanítható, gráfstruktúrájú tudáshálózat tartozik.

A nagyméretű nyelvi modellek (LLM) továbbra is nehezen birkóznak meg a kompetitív programozás szigorú logikai feladataival, hiába próbálkoznak többágensű keretrendszerek a megbízhatósági hiányosságok áthidalásával — írja az ArXiv-en megjelent kutatás.
Ezek a rendszerek alapvetően állapotmentesek, statikus lekérdezésre támaszkodnak, és elvetik a korábbi feladatokból szerzett értékes problémamegoldó és hibakeresési tapasztalatokat. Erre a problémára kínál megoldást a Solvita, egy ágens alapú evolúciós rendszer, amely folyamatos tanulást tesz lehetővé anélkül, hogy az alapul szolgáló LLM súlyait frissíteni kellene.
A Solvita a problémamegoldást egy zárt hurkú rendszerbe szervezi, amely stratégiaválasztásból, programszintézisből, tanúsított felügyeletből és célzott "hackelésből" áll. A rendszer működése során az eredményjelek, mint például a sikeres/sikertelen ítéletek, a tesztminőség és az ellenállás felfedezett sebezhetőségek, mind visszacsatolódnak a tudáshálózatokba.
A Solvita rendszerrel a modellek képesek a korábbi tapasztalatokból tanulni, ami jelentősen javíthatja a programozási feladatok megoldásának hatékonyságát és pontosságát.