Kutatás2026. máj. 2.frissítve: 23:10

Javítja a maszkolt diffúziós modellek teljesítményét az önszabályozás

A maszkolt diffúziós modellek (MDM) eddig korlátozottan tudták finomítani a még maszkolt pozíciókat, de egy új módszer ezen változtat.

Fotó: Mason C / Unsplash

forrás: ArXiv ML·AI Forradalom szerk.·2026. május 2.

Megosztás

A maszkolt diffúziós modellek (MDM) diszkrét szekvenciákat generálnak iteratív zajtalanítással, egy elnyelő maszkolási folyamat alatt — derül ki az arXiv-on előnyomtatott formában megjelent tanulmányból.

A standard maszkolt diffúziós modellek eddig elvetették a tiszta állapotú előrejelzéseket a még maszkolt pozíciók esetében. Ez a tervezési döntés korlátozta a lépések közötti finomítást, mivel a maszkolt pozíciókat újra és újra csak a maszk tokenből kellett kikövetkeztetni.

Ezt a korlátot oldja fel az új, önszabályozó adaptáció, a Self-Conditioned Masked Diffusion Models (SCMDM). A módszer minden zajtalanítási lépést a modell saját korábbi tiszta állapotú előrejelzéseihez igazít, minimális architekturális változtatással.

A SCMDM nem vezet be rekurrens látens állapotú útvonalat, nem támaszkodik segédreferencia modellre, és nem igényel extra denoiser kiértékeléseket a mintavételezés során. Ez jelentős előrelépést jelent a szekvenciagenerálás hatékonyságában, anélkül, hogy növelné a számítási igényt.

tetszett a cikk? oszd meg →

Megosztás