Kisebb nyelvi modellek is hatékonyak lehetnek bírósági ítéletek generálásában
A 2 milliárd paraméternél kisebb modellek is megbízhatóan képesek bírósági ítéleteket generálni és vádat előrejelezni büntetőügyekben.

Rendszeresen vizsgálják könnyűsúlyú, 2 milliárd paraméternél kisebb nyelvi modellek (LLM) képességeit a büntetőügyek bírósági ítéleteinek generálásában (CVG), valamint a vádelőrejelzésben — írja az arXiv-on megjelent tanulmány.
A kutatás arra fókuszál, hogy az eltérő LLM-architektúrák miként befolyásolják a CVG minőségét és a vádelőrejelzést. Emellett azt is elemzik, hogy a modell mérete milyen mértékben járul hozzá a teljesítményhez, és hogyan viszonyulnak a könnyűsúlyú LLM-ek a hagyományos mély neurális hálózatokhoz (DNN) ezekben a feladatokban.
A tanulmány egy másik fontos kérdést is megválaszol: hatékonyabb-e a vádat előrejelezni előbb bírósági ítélet generálásával, vagy közvetlenül. A jogi mesterséges intelligencia (Legal AI) területén ez a megközelítés mélyebb betekintést nyújt a kisebb modellek potenciáljába.
Igazságszolgáltatás és technológiai átalakulás
A kutatók egy CVGEvalKit nevű értékelőrendszert is kifejlesztettek. Ez a rendszer három nyilvánosan elérhető adatkészletet tartalmaz a CVG-feladatokhoz és a vádelőrejelzéshez. A modelleket ezen a keretrendszeren belül, vegyes adatokon képezték.
Mesterséges intelligencia a bírósági döntéshozatalban
A tanulmány előnyomtatott formában érhető el az arXiv felületén, 2024. március 10-én.