Kutatás2026. ápr. 23.frissítve: 03:10

Új hibajavító módszert javasolnak a maszkolt diffúziós nyelvi modellekhez

A jelenlegi Token-to-Token (T2T) szerkesztési módszerrel szemben a T2M a gyanús tokeneket maszk állapotba állítja vissza, így a modell a kontextusból újra tudja jósolni azokat.

Fotó: Michael / Unsplash

forrás: ArXiv NLP·AI Forradalom szerk.·2026. április 23.

Megosztás

Új, tréningmentes módszert javasolnak a maszkolt diffúziós nyelvi modellek, például a LLaDA2.1 generációs hibáinak javítására — derül ki az arXiv-on megjelent előnyomtatott tanulmányból.

A kutatók szerint a jelenlegi Token-to-Token (T2T) szerkesztési eljárás, amelyet az ilyen modellek a hibák korrigálására használnak, három fő strukturális hibával küzd. Egyrészt a javítás nem indul el, ha nincs kellően magabiztos alternatív token. Másrészt a csere egy olyan kontextusban történik, amely maga is hibákat tartalmazhat. Végül pedig a T2T betanításához használt uniform perturbációk nem hasonlítanak azokra a koherens, szemantikailag is hihető hibákra, amelyeket a modell valójában elkövet az inferencia során.

A Token-to-Mask (T2M) remasking megoldása

Alternatívaként a Token-to-Mask (T2M) remasking módszert vezették be. Ez a megközelítés nem írja felül a gyanús tokent egy új tippel, hanem visszaállítja a pozíciót maszk állapotba. Így a következő zajcsökkentési lépés során a modell egy „in-distribution” kontextusból jósolja meg újra a tokent.

A T2M módszer teljesen tréningmentes, kizárólag a szerkesztési szabályt módosítja, és nem vezet be új paramétereket. Ez jelentős előny, mivel nem igényel további betanítási időt vagy számítási kapacitást. A tanulmány az arXiv:2604.18738v1 azonosító alatt érhető el, ahol részletesen bemutatják a módszer elméleti alapjait és működését.

tetszett a cikk? oszd meg →

Megosztás