Kutatás2026. máj. 20.frissítve: 07:30

Megbízhatóbbá teszi a világmodelleket a PROWL — ritka hibákat is kijavít

A diffúzió alapú világmodellek eddig megbízhatatlanok voltak a ritka, de kritikus interakciókban, ám a PROWL aktívan keresi és kijavítja ezeket a hibákat.

Fotó: Maxence Pira / Unsplash

forrás: ArXiv ML·AI Forradalom szerk.·2026. május 20.

Megosztás

A modern, cselekvés-vezérelt videó alapú világmodellek valósághűen szimulálják a rövid távú vizuális eseményeket, ám megbízhatatlanok a ritka, interakció-kritikus átmenetek kezelésében — írják az arXiv-on publikáló kutatók.

Ezek a ritka, de nagy hatású helyzetek kulcsfontosságúak a tervezés és a viselkedéspolitika szempontjából, de a passzív adatokból történő betanítás során alulreprezentáltak. A robusztusság javításához ezért aktívan fel kell tárni a modellhibákat, nem pedig a természetes előfordulásukra várni.

A PROWL módszer lényege

A PROWL módszer egy KL-korlátozott ellenséges tanítási ciklust vezet be, ahol egy viselkedési politika arra van kiképezve, hogy feltárja a diffúzió alapú világmodell magas hibájú trajektóriáit, miközben közel marad a viselkedési eloszláshoz — magyarázzák a kutatók.

A világmodellt folyamatosan finomhangolják ezeken az ellenségesen felfedezett trajektóriákon. Ez az ellenséges tanítási ciklus a ritka hibákat stabil, az eloszláshoz közeli betanítási jellé alakítja, anélkül, hogy a modell a megszokott adateloszlásból kizökkenne.

A PROWL biztosítja, hogy a modell fejlődésével a fel nem oldott gyengeségekre nehezedő nyomás fennmaradjon, ezzel folyamatosan javítva a rendszer megbízhatóságát. A kutatás az arXiv:2605.18803v1 számon érhető el előnyomtatott formában.

tetszett a cikk? oszd meg →

Megosztás