Frissítve: 10 perce·Ma: 10
Kutatás
AI által generált szöveg

Logaritmikusan romlik a LLM-ügynökök képességválasztása a könyvtár méretével

A kutatók 15 élvonalbeli nagyméretű nyelvi modell (LLM) és több mint 1100 valós képesség elemzésével azonosították a rendszerek működését meghatározó két alapvető törvényt.

Logaritmikusan romlik a LLM-ügynökök képességválasztása a könyvtár méretével
Fotó: Christian Wiediger / Unsplash
Forrás: ArXiv NLPSzerző: AI Forradalom szerk.
Megosztás

Az ügynökrendszerek képességeinek skálázási törvényeit eddig kevéssé értették, pedig a moduláris képességek kulcsfontosságúak a LLM-ek funkcionalitásának bővítéséhez. Most azonban két, egymással összefüggő törvényt azonosítottak a területen – írja az arXiv-on megjelent tanulmány.

A kutatók 15 élvonalbeli LLM-et, 1141 valós képességet és több mint 3 millió routing- vagy végrehajtási döntést vizsgáltak meg. Az első, úgynevezett routing-törvény szerint az egy lépéses routing pontossága logaritmikusan csökken a képességkönyvtár méretével. Ez a jelenség a R2 > 0,97 értékkel minden modellnél megfigyelhető volt, és a hibák a helyi képességversenytől a családok közötti eltolódáson át a túlságosan általános „fekete lyuk képességek” általi elfogásig terjedhetnek.

A képességkönyvtár mélysége

A második, végrehajtási törvény azt mutatja, hogy a helyes végrehajtás négyszeres javulást hozhat a nehéz, későbbi döntésekben. Az eredmények szerint a közös routing hozzávetőlegesen multiplikatív, mielőtt a rendszer realizálná az állapotot. Ez a két törvény egyetlen paraméter, a logaritmikus routing-romlás 'b' meredeksége által kapcsolódik össze.

A logaritmikus romlás határa

Ez a 'b' paraméter előrejelzi a végrehajtási oldali „mentést” a modellek között, jelezve, hogy ugyanaz a könyvtártulajdonság szabályozza az előzetes végrehajtás összeomlását és a későbbi helyreállíthatóságot. A kutatók szerint az arXiv-on megjelent tanulmány adatai alapján a logaritmikus routing-romlás 2024. év végére várhatóan további 5%-kal csökken a jelenlegi értékeken.

Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom