DeepReviewer 2.0 37%-kal növeli a főbb hibák lefedettségét ICLR 2025-en
Egy új, 196 milliárd paraméteres modellre épülő rendszer auditálható lektorálási csomagot biztosít, amely a kritikus hibák 37,26%-os lefedettségét éri el ICLR 2025 beadandóin.

Traceálható felülvizsgálati csomagot állít elő a DeepReviewer 2.0, amely egy kimeneti szerződés mentén működik, és csak akkor exportál, ha a minimális nyomonkövethetőségi és lefedettségi költségvetést teljesíti — írja az arXiv.
A felfedezés fonalán
A rendszer először egy kézirat‑csak állítás‑bizonyíték‑kockázat főkönyvet és ellenőrzési napirendet hoz létre, majd az agenda‑vezérelt visszakeresés segítségével gyűjti a releváns adatokat, és a visszakeresett anyagokhoz rögzített kritikai megjegyzéseket fűz a kimeneti kapu alá.
A sikeres teszt részletei
134 ICLR 2025 beadandón három rögzített protokoll szerint tesztelték a rendszert, és egy finomhangolatlan 196 milliárd paraméteres modell futtatásával a DeepReviewer 2.0 felülmúlta a Gemini‑3.1‑Pro‑preview-et, a szigorú fő‑hiba lefedettség 37,26 %‑ra emelkedett a 23,57 %-os szint helyett, és 71 nyertes értékelést ért el. A DeepReviewer 2.0 tesztelése 2025. március 10-én fejeződött be.