AutoTTS 70%-os token‑használat csökkentést ér el a self‑consistency‑hez képest
A kutatók a Claude Code ügynöknek egy szimulált környezetet adtak, ahol önállóan tervezett tesztidő‑skálázási algoritmust, amely 70%-os token‑használat csökkenést hoz, miközben a pontosság változatlan marad, és mindössze 40 USD költséggel, 160 perc alatt került felfedezésre.

Az University of Maryland, University of Virginia, Washington University in St. Louis, University of North Carolina, Google és a Meta kutatócsoportja közösen bemutatta az AutoTTS rendszert, amely lehetővé teszi, hogy egy kódoló ügynök – a Claude Code – saját tesztidő‑skálázási algoritmust fedezzen fel egy szimulált környezetben — írja a The Decoder.
A tesztidő‑skálázás új dimenziója
A hagyományos megközelítésekben az ember írja a szabályokat, amelyek meghatározzák, mikor indítanak új megoldási útvonalat vagy mikor állítanak le egy már folyamatban lévőt, ami gyakran túlzott számítási költséghez vezet.
Az AutoTTS hatékonysága
Az AutoTTS egy offline szimulációs környezetet használ: a nyelvi modell előre generál több lehetséges megoldási útvonalat, majd egy magas szintű vezérlő, amelyet a Claude Code ír, dönt a számítási erőforrások elosztásáról a már meglévő adatok alapján.
A kódoló ügynök által kifejlesztett algoritmus a matematikai benchmarkokon, például az AIME és a HMMT teszteken, a token‑használatot körülbelül 70 %-kal csökkenti a standard self‑consistency-hez képest, miközben a pontosság változatlan marad; a teljes felfedezés mindössze 40 USD költséggel és 160 perc futási idővel valósult meg.
A Claude Code által felfedezett algoritmus a DeepSeek‑R1‑Distill‑Llama‑8B modellen és a GPQA‑Diamond benchmarkon is alkalmazható.
Az AutoTTS rendszerrel végzett kísérletek 2024. március 10-én fejeződtek be.