Új SDM módszer növeli a modell-robusztusság értékelésének hatékonyságát
A Sequential Difference Maximization (SDM) néven bemutatott új megközelítés a korábbi APGD-módszerek óta stagnáló területen hoz áttörést, új optimalizálási célkitűzéssel.

Jelentős előrelépést hozhat a gépi tanulási modellek robusztusságának értékelésében egy új, grádiens alapú támadási módszer, a Sequential Difference Maximization (SDM) — írja az arXiv-on megjelent tanulmány. A kutatók szerint az APGD bevezetése óta nehezen értek el jelentős áttöréseket ezen a területen.
A SDM fejlesztői először elemezték a „magas veszteségű nem-ellenséges példák” problémáját, amely rontja a korábbi támadási módszerek teljesítményét. Bebizonyították, hogy ez a jelenség az ellenséges példák generálásához használt nem megfelelő célkitűzésekből fakad.
Ezt követően a kutatók új célkitűzést fogalmaztak meg: a „nem-találati címke valószínűségi felső határa és a találati címke valószínűsége közötti különbség maximalizálását”. Ezzel a megközelítéssel jött létre a SDM, amely egy újszerű és hatékony grádiens alapú támadási módszer.
A robusztusság értékelésének új távlati
A SDM egy háromrétegű optimalizálási keretrendszert hoz létre, amely „ciklus-szakasz-lépés” elven működik. A kezdeti és a későbbi optimalizálási fázisokban negatív valószínűségi veszteségfüggvényt és Directional Probability Difference Ratio (DPDR) veszteségfüggvényt alkalmaz.
Optimális támadási stratégia
A kutatók a SDM módszert tesztelték, és az eredmények azt mutatták, hogy a SDM hatékonyabban működik, mint a korábbi módszerek. A tesztek során a SDM 2023. február 10-én az arXiv-on megjelent tanulmányban ismertetett eredményeket hozta.