Kisebb nyelvi modellek is hatékonyak lehetnek bírósági ítéletek generálásában

Rendszeresen vizsgálják könnyűsúlyú, 2 milliárd paraméternél kisebb nyelvi modellek (LLM) képességeit a büntetőügyek bírósági ítéleteinek generálásában (CVG), valamint a vádelőrejelzésben — írja az arXiv-on megjelent tanulmány.

A kutatás arra fókuszál, hogy az eltérő LLM-architektúrák miként befolyásolják a CVG minőségét és a vádelőrejelzést. Emellett azt is elemzik, hogy a modell mérete milyen mértékben járul hozzá a teljesítményhez, és hogyan viszonyulnak a könnyűsúlyú LLM-ek a hagyományos mély neurális hálózatokhoz (DNN) ezekben a feladatokban.

A tanulmány egy másik fontos kérdést is megválaszol: hatékonyabb-e a vádat előrejelezni előbb bírósági ítélet generálásával, vagy közvetlenül. A jogi mesterséges intelligencia (Legal AI) területén ez a megközelítés mélyebb betekintést nyújt a kisebb modellek potenciáljába.

Igazságszolgáltatás és technológiai átalakulás

A kutatók egy CVGEvalKit nevű értékelőrendszert is kifejlesztettek. Ez a rendszer három nyilvánosan elérhető adatkészletet tartalmaz a CVG-feladatokhoz és a vádelőrejelzéshez. A modelleket ezen a keretrendszeren belül, vegyes adatokon képezték.

Mesterséges intelligencia a bírósági döntéshozatalban

A tanulmány előnyomtatott formában érhető el az arXiv felületén, 2024. március 10-én.