
Interaktív IRL-t fejlesztettek ki a kutatók: kétlépcsős optimalizációval tanul a modell
Az új megközelítés lehetővé teszi, hogy a tanuló aktívan kommunikáljon a szakértővel, nem csak passzívan megfigyelje annak demonstrációit, ezzel áthidalva a korábbi IRL-rendszerek korlátait.



















