Alkalmazások2026. ápr. 15.frissítve: 06:26

DeepReviewer 2.0 37%-kal növeli a főbb hibák lefedettségét ICLR 2025-en

Egy új, 196 milliárd paraméteres modellre épülő rendszer auditálható lektorálási csomagot biztosít, amely a kritikus hibák 37,26%-os lefedettségét éri el ICLR 2025 beadandóin.

Fotó: Fotó: Daniil Komov / Unsplash

forrás: ArXiv AI·AI Forradalom szerk.·2026. április 15.

Megosztás

Traceálható felülvizsgálati csomagot állít elő a DeepReviewer 2.0, amely egy kimeneti szerződés mentén működik, és csak akkor exportál, ha a minimális nyomonkövethetőségi és lefedettségi költségvetést teljesíti — írja az arXiv.

A felfedezés fonalán

A rendszer először egy kézirat‑csak állítás‑bizonyíték‑kockázat főkönyvet és ellenőrzési napirendet hoz létre, majd az agenda‑vezérelt visszakeresés segítségével gyűjti a releváns adatokat, és a visszakeresett anyagokhoz rögzített kritikai megjegyzéseket fűz a kimeneti kapu alá.

A sikeres teszt részletei

134 ICLR 2025 beadandón három rögzített protokoll szerint tesztelték a rendszert, és egy finomhangolatlan 196 milliárd paraméteres modell futtatásával a DeepReviewer 2.0 felülmúlta a Gemini‑3.1‑Pro‑preview-et, a szigorú fő‑hiba lefedettség 37,26 %‑ra emelkedett a 23,57 %-os szint helyett, és 71 nyertes értékelést ért el. A DeepReviewer 2.0 tesztelése 2025. március 10-én fejeződött be.

tetszett a cikk? oszd meg →

Megosztás