Új AI-magyarázó keretrendszer garantálja a biztonságot az autonóm járművekben
A mesterséges intelligencia magyarázhatóságát vizsgáló új keretrendszer, a ViTaX, a téves besorolások eltérő súlyosságát is figyelembe veszi, ami kulcsfontosságú az önvezető autók és orvosi diagnosztikai rendszerek esetében.

A mély neurális hálózatok egyre szélesebb körben terjednek el a biztonságkritikus területeken, például az autonóm járművekben és az orvosi diagnosztikában. Ezeken a területeken elengedhetetlen, hogy az AI-rendszerek döntései ne csak értelmezhetők, hanem megbízhatók is legyenek, formális garanciákkal alátámasztva — írja az arXiv.
A jelenlegi magyarázható mesterséges intelligencia (XAI) módszerek azonban hiányosságokkal küzdenek. A heurisztikus attribúciós technikák, mint a LIME vagy az Integrated Gradients, ugyan kiemelik a befolyásoló jellemzőket, de nem adnak matematikai garanciákat a döntési határokra vonatkozóan. A formális módszerek pedig, bár ellenőrzik a robusztusságot, nem célzottak, és a legközelebbi határt elemzik, függetlenül attól, hogy a kritikus kockázatot jelent-e.
Célzott magyarázatok a biztonságért
A biztonságkritikus rendszerekben nem minden téves besorolás hordoz azonos következményeket. Például egy „Stop” tábla összetévesztése egy „60 km/h” táblával sokkal veszélyesebb, mint egy „Előzni tilos” táblával való összekeverése. Erre a problémára kínál megoldást a ViTaX (Verified and Targeted Explanations) nevű új, formális XAI keretrendszer.
A ViTaX célzott szemifaktuális magyarázatokat generál matematikai garanciákkal. Ez azt jelenti, hogy a rendszer képes azonosítani, hogy egy adott bemenet (például egy kép) miért került egy bizonyos osztályba, és milyen minimális változtatásokra lenne szükség ahhoz, hogy egy másik, felhasználó által meghatározott osztályba kerüljön – különös tekintettel a kritikus téves besorolások elkerülésére.
A ViTaX hatékonysága
Az új keretrendszer az arXiv:2604.14209v1 azonosító alatt jelent meg előnyomtatott formában. A ViTaX a Tesla autonóm járművekben használt mesterséges intelligencia rendszerében való alkalmazását tervezik a közeljövőben.