Frissítve: 18 perce·Ma: 38
Alkalmazások
AI által generált szöveg

DeepReviewer 2.0 37%-kal növeli a főbb hibák lefedettségét ICLR 2025-en

Egy új, 196 milliárd paraméteres modellre épülő rendszer auditálható lektorálási csomagot biztosít, amely a kritikus hibák 37,26%-os lefedettségét éri el ICLR 2025 beadandóin.

DeepReviewer 2.0 37%-kal növeli a főbb hibák lefedettségét ICLR 2025-en
Fotó: Daniil Komov / Unsplash
Forrás: ArXiv AISzerző: AI Forradalom szerk.
Megosztás

Traceálható felülvizsgálati csomagot állít elő a DeepReviewer 2.0, amely egy kimeneti szerződés mentén működik, és csak akkor exportál, ha a minimális nyomonkövethetőségi és lefedettségi költségvetést teljesíti — írja az arXiv.

A felfedezés fonalán

A rendszer először egy kézirat‑csak állítás‑bizonyíték‑kockázat főkönyvet és ellenőrzési napirendet hoz létre, majd az agenda‑vezérelt visszakeresés segítségével gyűjti a releváns adatokat, és a visszakeresett anyagokhoz rögzített kritikai megjegyzéseket fűz a kimeneti kapu alá.

A sikeres teszt részletei

134 ICLR 2025 beadandón három rögzített protokoll szerint tesztelték a rendszert, és egy finomhangolatlan 196 milliárd paraméteres modell futtatásával a DeepReviewer 2.0 felülmúlta a Gemini‑3.1‑Pro‑preview-et, a szigorú fő‑hiba lefedettség 37,26 %‑ra emelkedett a 23,57 %-os szint helyett, és 71 nyertes értékelést ért el. A DeepReviewer 2.0 tesztelése 2025. március 10-én fejeződött be.

Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom