Kutatás2026. máj. 20.frissítve: 19:50

ReCrit: Új RL-modell védi a tudományos válaszokat a káros kritikától

A modell a kritikai interakciót átmeneti problémaként kezeli, nem pedig a végső válasz pontosságaként, ezzel kiküszöbölve a szikofancia kockázatát.

Fotó: Marvin Radke / Unsplash

forrás: ArXiv ML·AI Forradalom szerk.·2026. május 20.

Megosztás

Új megerősítő tanulási keretrendszert mutatott be az arXiv-on egy kutatás, amelynek célja, hogy a nagyméretű nyelvi modellek (LLM) ne adják fel a kezdetben helyes tudományos megoldásokat a felhasználói kritika hatására — írja az arXiv.

A ReCrit névre keresztelt rendszer a kritikai interakciót négy kvadránsra bontja: Korrekció, Szikofancia, Robusztusság és Határ. Ezzel a megközelítéssel a modell jutalmazza a korrekciót és a robusztusságot, miközben bünteti a szikofanciát, vagyis azt, amikor a modell indokolatlanul elfogadja a felhasználói kritikát, még akkor is, ha az eredeti válasz helyes volt.

A ReCrit működése és előnyei

A ReCrit a kezdeti és a kritika utáni viselkedést elemzi. A tartós hibákat gyenge határjelekként kezeli. A rendszer dinamikus aszinkron bevezetést és farok-adaptációt használ, hogy az interakciós betanítás gyakorlatias és skálázható legyen.

A tudományos érvelés biztonsága

A kutatás szerint a ReCrit különösen fontos a tudományos érvelésben, ahol a felhasználói visszajelzés könnyen tévútra viheti a modelleket, és egy érvényes választ hibássá változtathat. A modell 2605.18799v1 verziószámmal jelent meg az arXiv-on 2023. március 15-én.

tetszett a cikk? oszd meg →

Megosztás