ÉlőUtoljára: 15 perceMa: 7
Kutatásfrissítve: 15:10

A 2021-es EDEN kvantálási algoritmus veri a 2026-os TurboQuantot

Az EDEN-unbiased változat például egy bittel kevesebb adatot használva is felülmúlja a TurboQuant-prod pontosságát, jelentős hatékonyságnövelést kínálva.

A 2021-es EDEN kvantálási algoritmus veri a 2026-os TurboQuantot
Fotó: Fotó: unavailable parts / Unsplash
forrás: Towards Data Science·AI Forradalom szerk.·
Megosztás

A 2026-os ICLR konferencián nagy figyelmet kapott a TurboQuant nevű online vektorkvantálási módszer, ám úgy tűnik, egy 2021-es algoritmus, az EDEN már évekkel korábban hasonló, sőt jobb eredményeket ért el — írja a Towards Data Science.

Az EDEN, amelyet először DRIVE néven mutattak be 2021-ben a NeurIPS-en, majd 2022-ben az ICML-en általánosítottak tetszőleges bitméretekre, a TurboQuanttal jelentős átfedést mutat. Egy friss összehasonlítás szerint a TurboQuant-mse az EDEN egy degenerált esete, és az EDEN variánsai következetesen felülmúlják a TurboQuant megfelelőit.

Az optimális skálázás ereje

Az EDEN algoritmus négy lépésben tömörít egy vektort: véletlenszerű rotáció, skaláris kvantálás, skálázás és inverz rotáció. A kulcsfontosságú különbség a skálázási faktor (S) kiválasztásában rejlik. Míg az EDEN analitikusan vezeti le az optimális S értéket, addig a TurboQuant-mse kihagyja ezt az optimalizált skálázást, holott a MSE minimalizálását célozza.

Az optimális S alkalmazásának értéke a bitmérettel együtt nő. 4 bitnél és 128 dimenziónál az EDEN-biased 2,25%-kal csökkenti a MSE-t a TurboQuant-mse-hez képest. Ez a bitméret az, amit a szakemberek jellemzően használnak beágyazásokhoz és KV-gyorsítótárakhoz. Az EDEN-biased minden tesztelt dimenzióban (16-tól 4096-ig) és bitméretben (1, 2, 3, 4 bit) alacsonyabb hibát produkált.

Torzításmentes tömörítés és a gyakorlati előnyök

A torzításmentes (unbiased) tömörítés különösen fontos olyan alkalmazásoknál, mint a disztribúált betanítás, ahol sok kvantált vektort átlagolnak. Az EDEN-unbiased ugyanazt az egyfázisú algoritmust használja, mint az EDEN-biased, csak más S értéket választ a torzítás korrigálására. Ezzel szemben a TurboQuant-prod, a TurboQuant torzításmentes változata, a bitköltség egy részét egy QJL (Quantized Johnson–Lindenstrauss) korrekcióra fordítja.

Az EDEN-unbiased minden tesztelt konfigurációban jelentős mértékben felülmúlja a TurboQuant-prodot. Ennek oka az EDEN egyfázisú kialakításának három strukturális előnye: az EDEN optimalizálja a skálát, az EDEN 1-bites felépítése alacsonyabb varianciával rendelkezik, és az EDEN a teljes bitköltséget egyetlen torzításmentes kvantálóra fordítja. Ez a hatás olyan mértékű, hogy a 1, 2 és 3 bites EDEN-unbiased pontosabb, mint a 2, 3 és 4 bites TurboQuant-prod, ami azt jelenti, hogy az EDEN használatával egy bittel kevesebb is elég lehet a TurboQuant-prod pontosságának eléréséhez.

tetszett a cikk? oszd meg →
Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom