RTI-Bench: Indiai jogi döntések elemzésére készült új adathalmaz 89%-os lefedettséggel
Az új, strukturált adathalmaz az indiai információszabadság-törvény (RTI) alapján hozott döntéseket elemzi, segítve az állampolgárokat a bonyolult jogi nyelvezet megértésében.

Új, strukturált adathalmazt mutatott be az indiai jogi döntések elemzésére a RTI-Bench — írja az arXiv-on megjelent tanulmány. A RTI-Bench célja, hogy az indiai állampolgárok könnyebben értelmezhessék a Központi Információs Bizottság (CIC) döntéseit, és előre jelezhessék egy fellebbezés sikerességét.
Az adathalmaz az első nyilvánosan elérhető strukturált gyűjtemény az indiai RTI közigazgatási döntésekről. Két forrásból származó adatokat tartalmaz: 1218 esetet egy már létező utasítás-válasz korpuszból, valamint 298 CIC döntési PDF-et, amelyeket közvetlenül a Bizottság portáljáról gyűjtöttek. Ezek az esetek öt biztos és három dokumentumformátum-generáció döntéseit ölelik fel, a 2023 és 2026 közötti időszakból.
A RTI-Bench adatai kimeneti címkéket, mentességi hivatkozásokat, IRAC-stílusú érvelési komponenseket és eljárási idővonalakat tartalmaznak. Az adathalmaz címke-lefedettsége eléri a 89%-ot, ami jelentős előrelépést jelent a jogi AI-modellek betanításában.
A jogi átláthatóság fokozása
Az Indiai Információszabadság-törvény (Right to Information Act, 2005) minden állampolgárnak jogot biztosít arra, hogy információt kérjen a közhivataloktól, de a gyakorlatban sokan nem tudják értelmezni a sűrű, adminisztratív nyelvezetet. A RTI-Bench ezen a problémán segíthet, átláthatóbbá téve a jogi folyamatokat a 1,4 milliárd lakosú országban.
Az adatok hatása a jogi döntésekre
A RTI-Bench adatait a jogi AI-modellek fejlesztésére használják majd, amelyek segítenek a jogi döntések előrejelzésében. A 2026-os év végéig tervezik a RTI-Bench további fejlesztését, amelyhez további adatokat gyűjtenek majd a Központi Információs Bizottságtól.
Az arXiv-on megjelent tanulmány szerint a RTI-Bench adathalmaz 2023. március 15-én került nyilvánosságra.