ÉlőUtoljára: 1 órájaMa: 1
Modellek & LLMfrissítve: 12:30

Automatizált LLM-stratégia: 69,5%-kal kevesebb token, pontosabb válaszok

Az AutoTTS keretrendszer automatikusan optimalizálja a LLM-ek számítási költségeit, akár 69,5%-kal csökkentve a tokenhasználatot pontosságvesztés nélkül.

Automatizált LLM-stratégia: 69,5%-kal kevesebb token, pontosabb válaszok
Fotó: Fotó: Rubaitul Azad / Unsplash
forrás: VentureBeat·AI Forradalom szerk.·
Megosztás

A LLM-ek teljesítményét tesztidőben skálázó (TTS) stratégiák eddig kézzel készültek, emberi intuícióra támaszkodva. A Meta, a Google és több egyetem kutatói most bemutatták az AutoTTS-t, ami automatikusan fedezi fel az optimális TTS-stratégiákat.

A TTS extra számítási kapacitást biztosít a modellnek válaszadáskor, lehetővé téve több érvelési út generálását vagy a lépések kiértékelését. Az optimális stratégia meghatározása eddig kézi munkát igényelt, ahol a mérnököknek kellett kitalálniuk a szabályokat és küszöbértékeket a modell viselkedésére.

Kapcsolódó: LLM-pontosság

A számítási kapacitás felfedezése

Az AutoTTS ezt a problémát algoritmikus keresési feladatként kezeli. A mérnökök feladata a felfedezési környezet megalkotása, beleértve a vezérlőteret, az optimalizálási célokat (pontosság vs. költség) és a visszacsatolási mechanizmusokat.

Kapcsolódó: LLM-programozás

Az explorer LLM szerepe

Egy „explorer” LLM, például a Claude Code, iteratívan javasol és tesztel TTS-vezérlőket egy offline replay környezetben, amely előre begyűjtött érvelési útvonalakat használ. Ez drasztikusan csökkenti a tesztelés számítási költségeit.

Kapcsolódó: nyílt forráskódú modell

Az automatizált felfedezés révén az AutoTTS olyan komplex szabályokat fedezhet fel, amelyeket emberi mérnökök valószínűleg nem kódolnának le. Ilyen például a „Confidence Momentum Controller”, amely nemcsak az azonnali, hanem az exponenciális mozgóátlag (EMA) alapján is dönt a leállításról, elkerülve a félrevezető pillanatnyi csúcsokat.

Kapcsolódó: kódellenőrzési pontosság

A kutatók Qwen3 modelleken (0,6B-8B paraméter) és a DeepSeek-R1 egy 8B-s változatán tesztelték a rendszert. Az AIME24 matematikai teljesítményteszten felfedezett stratégiát a későbbi AIME25 és HMMT25, valamint a GPQA-Diamond általános érvelési teljesítményteszten is kipróbálták. Az AutoTTS által talált vezérlő 69,5%-kal csökkentette a tokenhasználatot a hagyományos, kézzel készített stratégiákhoz képest, miközben a pontosság változatlan maradt, a Qwen3 modell 8B paraméteres verzióján.

Kapcsolódó: LLM-biztonság

tetszett a cikk? oszd meg →
Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom