LLM-eknek ad teljes böngésző-szabadságot a Browser Harness — 7.1k GitHub csillaggal
A projekt 7100 GitHub csillagot és 629 fork-ot gyűjtött, ami a közösség jelentős érdeklődését mutatja a LLM-alapú böngésző-automatizálás iránt.

Új nyílt forráskódú eszközt mutattak be Browser Harness néven, amely teljes szabadságot ad a nagyméretű nyelvi modelleknek (LLM) bármilyen böngészőfeladat elvégzésére — írja a Hacker News.
A projekt a Chrome DevTools Protocol (CDP) protokollra épül, és egyetlen websockettel kapcsolódik a Chrome-hoz, így nincs szükség bonyolult keretrendszerekre vagy előre megírt receptekre. Az ügynök képes önállóan kiegészíteni a hiányzó kódot a feladat közben, például ha egy fájl feltöltéséhez szükséges függvény hiányzik, azt maga írja meg a helpers.py fájlba.
A böngésző-automatizálás kulcsa
A Browser Harness mindössze 592 sor Python kódból áll, ami rendkívül egyszerűvé teszi a telepítést és a használatot. A run.py fájl mindössze 36 sor, és előre betöltött segédfüggvényekkel futtatja a Python kódot. Az adminisztrációs és démon folyamatok (admin.py, daemon.py) további 361 sort tesznek ki, amelyek a CDP websocketet és a socket hidat kezelik.
Fejlesztési lehetőségek
A fejlesztők távoli böngészőket is használhatnak, amelyek hasznosak lehetnek lopakodó ügynökök, alügynökök vagy telepítések esetén. A Browser Harness ingyenes szintje három párhuzamos böngészőt, proxykat és captcha-megoldást is kínál, bankkártya adatok megadása nélkül. Az ügynök akár maga is regisztrálhat a szolgáltatásra.
A projekt aktívan várja a hozzájárulásokat, különösen az új „domain skill”-eket, amelyek konkrét webhelyekhez vagy feladatokhoz (pl. LinkedIn, Amazon, költségelszámolás) tanítják meg az ügynököt a szükséges szelektorokra és munkafolyamatokra. A legutóbbi frissítés 2024. március 15-én jelent meg a GitHubon.