Frissítve: 1 órája·Ma: 15
Kutatás
AI által generált szöveg

Új hibajavító módszert javasolnak a maszkolt diffúziós nyelvi modellekhez

A jelenlegi Token-to-Token (T2T) szerkesztési módszerrel szemben a T2M a gyanús tokeneket maszk állapotba állítja vissza, így a modell a kontextusból újra tudja jósolni azokat.

Új hibajavító módszert javasolnak a maszkolt diffúziós nyelvi modellekhez
Fotó: CDC / Unsplash
Forrás: ArXiv NLPSzerző: AI Forradalom szerk.
Megosztás

Új, tréningmentes módszert javasolnak a maszkolt diffúziós nyelvi modellek, például a LLaDA2.1 generációs hibáinak javítására — derül ki az arXiv-on megjelent előnyomtatott tanulmányból.

A kutatók szerint a jelenlegi Token-to-Token (T2T) szerkesztési eljárás, amelyet az ilyen modellek a hibák korrigálására használnak, három fő strukturális hibával küzd. Egyrészt a javítás nem indul el, ha nincs kellően magabiztos alternatív token. Másrészt a csere egy olyan kontextusban történik, amely maga is hibákat tartalmazhat. Végül pedig a T2T betanításához használt uniform perturbációk nem hasonlítanak azokra a koherens, szemantikailag is hihető hibákra, amelyeket a modell valójában elkövet az inferencia során.

A Token-to-Mask (T2M) remasking megoldása

Alternatívaként a Token-to-Mask (T2M) remasking módszert vezették be. Ez a megközelítés nem írja felül a gyanús tokent egy új tippel, hanem visszaállítja a pozíciót maszk állapotba. Így a következő zajcsökkentési lépés során a modell egy „in-distribution” kontextusból jósolja meg újra a tokent.

A T2M módszer teljesen tréningmentes, kizárólag a szerkesztési szabályt módosítja, és nem vezet be új paramétereket. Ez jelentős előny, mivel nem igényel további betanítási időt vagy számítási kapacitást. A tanulmány az arXiv:2604.18738v1 azonosító alatt érhető el, ahol részletesen bemutatják a módszer elméleti alapjait és működését.

Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom