ÉlőUtoljára: 46 perceMa: 4
Hogyan működik?frissítve: 07:57

Az OpenAI ügynökei CLI eszközökkel dolgoznak: így működik a tool use a háttérben

Ez a technológia lehetővé teszi, hogy az ügynökök komplex feladatokat lássanak el, például adatbázisok kezelését vagy külső alkalmazások vezérlését.

Az OpenAI ügynökei CLI eszközökkel dolgoznak: így működik a tool use a háttérben
Fotó: Fotó: Homa Appliances / Unsplash
forrás: Ben's Bites·AI Forradalom szerk.·
Megosztás

Az OpenAI ügynökei már nem csak szöveges válaszokat adnak, hanem képesek valós feladatokat elvégezni, például fájlokat rendezni vagy weboldalakat kezelni — írja a Ben's Bites.

A „szerszámhasználat” lényege, hogy a nagyméretű nyelvi modellek (LLM-ek) parancssori eszközökkel kommunikálnak. Mivel az ügynökök szöveges bemenetet és kimenetet használnak, a CLI eszközök, amelyek szintén szöveges alapon működnek, természetes illeszkedést biztosítanak számukra. Ezek a szöveges parancsok lehetővé teszik a szoftverek vezérlését, így az ügynökök ténylegesen „csinálnak” dolgokat ahelyett, hogy csak válaszolnának.

Így rendez 400 fotót egy ügynök

Egy egyszerű példa a fájlok rendszerezése a bash eszközzel: egy ügynök másodpercek alatt képes 400 termékfotót átnevezni, átméretezni 1200x1200 pixelre, majd kategóriák szerint mappákba rendezni. Ehhez először listázza a fájlokat a ls paranccsal, majd mappaszerkezetet hoz létre a mkdir segítségével. Az átméretezést a mogrify -resize 1200x1200 paranccsal végzi, végül a mv paranccsal nevezi át és rendezi a képeket. A folyamat végén ellenőrzi az eredményt, mielőtt visszaküldené a felhasználónak.

A bash mellett számos célzott CLI létezik specifikus feladatokra. A Stripe CLI például bevételi adatok lekérésére vagy előfizetések kezelésére alkalmas, a Playwright webböngészőket vezérel (navigál, kattint, űrlapokat tölt ki), az AWS CLI szervereket indít és adatbázisokat kezel, a Vercel CLI pedig weboldalakat telepít. Minél több ilyen CLI-hez fér hozzá egy ügynök, annál sokoldalúbbá válik, és annál több feladatot tud elvégezni.

Bár a felhasználói felületek gyakran elrejtik ezeket a technikai részleteket, az ügynökök a háttérben folyamatosan futtatják ezeket a parancsokat. Például a Claude Code bevezetett egy „auto mode” funkciót az ügynöki műveletek kezelésére, és a Claude munkaeszköz-csatlakozói már mobilon is elérhetők. Az Anthropic emellett a „auto-dream” funkción dolgozik, amely éjszaka tömöríti a memóriát.

tetszett a cikk? oszd meg →
Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom