AITP: Multimodális LLM osztja ki a felelősséget közlekedési baleseteknél
A modell a Multimodal Chain-of-Thought (MCoT) mechanizmussal és Retrieval-Augmented Generation (RAG) technológiával integrálja a jogi ismereteket a baleseti elemzésbe.

Új multimodális nagy nyelvi modellt (MLLM) mutatott be az ArXiv NLP, amely kifejezetten közlekedési balesetek felelősségének megállapítására készült. Az AITP (Artificial Intelligence Traffic Police) nevű rendszer a balesetek leírásán és értelmezésén túl mélyebb ok-okozati összefüggéseket keres, és jogi ismereteket is beépít az elemzésbe — írja a kutatást bemutató tanulmány.
A meglévő MLLM-ek eddig főként a baleseti videók leírására és értelmezésére koncentráltak, de a felelősség allokációja sokkal összetettebb feladat. Ez több lépésből álló érvelést igényel, amely szigorúan a közlekedési szabályokra épül. Az AITP éppen ezt a hiányosságot célozza meg, a jogi tudás integrálásával és a fejlett érvelési képességekkel.
A baleseti elemzés új dimenziói
A modell fejlesztéséhez a kutatók létrehozták a DecaTARA nevű, tíz, egymással összefüggő baleseti érvelési feladatot egyesítő teljesítménytesztet. Ez az adathalmaz 67 941 annotált videót és 195 821 kérdés-válasz párt tartalmaz, amelyek mind a baleseti felelősség megállapítását segítik. A DecaTARA egyedülálló módon egyesíti a vizuális és szöveges információkat, hogy a modell valósághűen tudjon érvelni.
Vizuális és szöveges információk integrációja
Az AITP bevezetése a közlekedésbiztonsági elemzésekben 2024-ben kezdődhet, a modell képes a komplex baleseti szituációk mélyreható vizsgálatára, figyelembe véve a jogi kereteket is. A rendszer a DecaTARA adathalmazán eddig 85%-os pontosságot ért el a baleseti felelősség megállapításában.