Kutatás2026. máj. 3.frissítve: 15:10

Új deepfake adathalmazzal segíti a Microsoft a valós idejű felismerést

A generatív AI által előállított média minősége folyamatosan javul, és a meglévő detektorok nehezen tartják a lépést az új tartalmakkal.

Fotó: Abid Shah / Unsplash

forrás: IEEE Spectrum AI·AI Forradalom szerk.·2026. május 3.

Megosztás

Új, sokszínű deepfake detektáló adathalmazt fejlesztett ki a Microsoft, a Northwestern Egyetem és a Witness nevű nonprofit szervezet. A Microsoft-Northwestern-Witness (MNW) teljesítményteszt célja, hogy valósághűbb és változatosabb mintákat biztosítson a detektorok képzéséhez, javítva azok hatékonyságát a „vadonban” is — írja az IEEE Intelligent Systems április 10-i számában.

Thomas Roca, a Microsoft vezető kutatója szerint az AI-generátorok nyomokat hagynak maguk után, apró jeleket vagy nyomokat, amelyek megerősíthetik, hogy a média hamis. Ezek a „artifactok” magukban foglalhatnak zajeloszlásokat, inkonzisztenciákat a pixelfoltok között, rések az audiojelekben és egyéb szabálytalanságokat.

A detektorok lemaradása

Kutatási csoportok világszerte hoznak létre detektorokat, amelyek lényegében AI-modellek, és arra képzik őket, hogy azonosítsák az artifactokat az AI-generált médiában. Azonban ez egy fegyverkezési verseny, ahol a generátorok sajnos előnyben vannak. Roca szerint a detektáló rendszerek még nem állnak készen a kihívásra, részben azért, mert a rendszerek értékelése nem megfelelő.

A változatos minták fontossága

A kihívások átfogóbb megközelítése érdekében a Microsoft, a Northwestern és a Witness szakértői együtt dolgoztak az új MNW teljesítményteszten. Macro Postiglione, a Northwestern Egyetem posztdoktori kutatója szerint az akadémia, az ipar és a terepen dolgozó nonprofit szervezet nézőpontjai együttesen teljesebb megközelítést eredményeznek. Az új adathalmaz célja, hogy a lehető legváltozatosabb mintákat tartalmazza a különböző generátoroktól származó AI-generált anyagokból, növelve a detektorok alkalmazhatóságát valós környezetben.

A csapat minden tavasszal és ősszel frissíteni fogja az adathalmazt, hogy tükrözze a legújabb generátorok artifactjait, valamint a detektáló rendszerek megtévesztésére használt trükköket. A MNW adathalmazt 2024. április 15-ig tervezik frissíteni, amelyhez a legújabb generátorokból származó mintákat fognak hozzáadni.

tetszett a cikk? oszd meg →

Megosztás