Frissítve: 57 perce·Ma: 9
Alkalmazások
AI által generált szöveg

Külön értékeli a feladatokat az Anthropic Claude Code /goals funkciója

Az új funkcióval a Claude Code ügynökök nem dönthetik el idő előtt, hogy egy feladat befejeződött, mivel egy különálló értékelő modell ellenőrzi a folyamatot.

Külön értékeli a feladatokat az Anthropic Claude Code /goals funkciója
Fotó: National Cancer Institute / Unsplash
Forrás: VentureBeatSzerző: AI Forradalom szerk.
Megosztás

Formálisan szétválasztja a feladatvégrehajtást és a feladatértékelést az Anthropic Claude Code /goals funkciója — írja a VentureBeat. Ezzel a módszerrel az AI ügynökök nem nyilváníthatják idő előtt befejezettnek a feladatokat, amikor azok még nem készültek el.

A Claude Code /goals lényegében egy második réteget ad a kódoló ügynökök munkafolyamatához. Miután a felhasználó definiálta a célt, a Claude lépésről lépésre halad, de minden egyes lépés után egy értékelő modell ellenőrzi, hogy a cél teljesült-e. Alapértelmezés szerint egy kisebb Haiku modell végzi az értékelést, amely mindössze két döntést hoz: kész van-e a feladat, vagy sem.

A rendszer célja, hogy csökkentse a harmadik féltől származó megfigyelési platformok és egyedi naplózás szükségességét. Az Anthropic szerint nincs szükség külső eszközökre, bár a vállalatok továbbra is használhatnak ilyeneket a Claude Code mellett. A versenytársak, mint a Google Agent Development Kit (ADK) és a LangChain is kínálnak hasonló független értékelési képességeket, de ezek gyakran több fejlesztői beállítást igényelnek.

Sean Brownell, a Sprinklr megoldási igazgatója a VentureBeatnek elmondta, hogy bár az ilyen típusú elválasztás hasznos, az Anthropic megközelítése nem egyedi. Szerinte a „készítő” és a „bíró” szétválasztása alapvető fontosságú, mivel egy modell nem bízható meg abban, hogy saját munkáját ítélje meg. Brownell kiemelte, hogy a módszer leginkább determinisztikus feladatoknál működik jól, mint például migrációk vagy tesztelési hibák javítása, ahol egyértelműen ellenőrizhető a végállapot. Az Anthropic megoldása a folyamatosan fejlődő ügynöktechnológiák egyre audítálhatóbb és megfigyelhetőbb rendszerek felé való elmozdulását mutatja.

Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom