AI ügynököknek szánt asztali CLI-t mutatott be a lahfir — 96%-kal csökkenti a tokenfelhasználást
A lahfir nevű GitHub-felhasználó által fejlesztett eszköz a macOS akadálymentesítési fáit használja, így elkerüli a képernyőképeket és a pixelillesztést, jelentősen csökkentve a tokenfelhasználást.

Új parancssori eszközt (CLI) mutatott be a lahfir nevű GitHub-felhasználó, amely az AI ügynökök számára teszi lehetővé az asztali alkalmazások natív automatizálását macOS rendszeren — írja a Hacker News.
Az Agent-desktop nevű, Rust nyelven írt program strukturált hozzáférést biztosít bármely alkalmazáshoz az operációs rendszer akadálymentesítési fáin keresztül. Ez a megközelítés feleslegessé teszi a képernyőképek, pixelillesztések vagy böngészőkövetelmények használatát, ami jelentős előnyt jelent a hagyományos automatizálási módszerekkel szemben.
A technológiai áttörés kapuja
Az eszköz 53 különböző parancsot kínál megfigyelésre, interakcióra, billentyűzet- és egérkezelésre, értesítésekre, vágólapra és ablakkezelésre. A sűrű alkalmazások (például Slack, VS Code, Notion) esetében a progresszív csontváz-bejárásnak köszönhetően 78–96%-os tokenmegtakarítás érhető el — állítja a projekt GitHub-oldala.
A hatékonyság kulcsa
Az Agent-desktop determinisztikus elemhivatkozásokat (Snapshot & refs) használ, és minden műveletnél először az akadálymentesítési API-kat próbálja meg kihasználni, mielőtt egéreseményekre esne vissza. A kimenet strukturált JSON formátumú, hibakódokkal és helyreállítási tippekkel. Az Agent-desktop a Rust 1.78+ és macOS 13.0+ rendszert igényel, és a lahfir GitHub-felhasználó 2024. március 10-én tette közzé.