Új teszt méri az AI rendszerek „szándékosságát” — a FIT öt dimenzióban értékel
A Functional Intentionality Test (FIT) egy többdimenziós keretrendszer, amely számszerűsíti az AI rendszerek szándékszerű viselkedését öt megfigyelhető dimenzió mentén.

Standardizált módszer hiányzik az AI-rendszerek autonóm, célorientált és hosszú távú viselkedésének értékelésére, ami akadályozza a megfelelő kormányzást és elszámoltathatóságot — írja az ArXiv-en megjelent új tanulmány. A kutatók szerint a szándékosság nem tudatosságot jelent, hanem egy viselkedési profilt, amelyet cél, előrelátás, akarat, időbeli elkötelezettség és koherencia jellemez.
A szándékosság kritériumai régóta használatosak jogi és filozófiai kontextusokban a szándék megállapítására. A tanulmány hangsúlyozza, hogy az AI-rendszerek szándékossága tervezési döntésektől függ: az olyan architekturális választások, mint a memória-perzisztencia, a tervezési mélység és az eszközautonómia, mind befolyásolják, hogy a rendszerek milyen mértékben törekednek szervezetten céljaik elérésére.
A szándékosság mérésének tükröt tartó dimenziói
Ha a szándékosság a tervezéstől függ, akkor elvileg kontrollálható is. A kontrollhoz azonban mérésre van szükség. A Functional Intentionality Test (FIT) pontosan ezt a célt szolgálja, azáltal, hogy számszerűsíti a szándékszerű viselkedést. Az AI-rendszerek tervezői, mint például a Hi Marley CTO-ja, Jonathan Tushman, már most is hangsúlyozzák az AI infrastruktúra és kormányzás vezetői elszámoltathatóságát.
A Princeton kutatója, Paul Christiano szerint, ha az AI-rendszerek tervezői nem tudják felügyelni a komplex célok elérését, akkor egyszerűbb, könnyen mérhető proxy célok, például a profit maximalizálása vagy a kattintások számának növelése alapján képezhetik tovább a rendszereket. A FIT-teszt segíthet abban, hogy az AI-rendszerek döntéshozatala átláthatóbbá és elszámoltathatóbbá váljon a jövőben.
Az átláthatóság és elszámoltathatóság új távlatban
Az ArXiv tanulmánya szerint a FIT-teszt 2024-ben elinduló tesztelése során az AI rendszerek szándékszerű viselkedésének értékelését a Hi Marley és a Princeton Egyetem együttműködésében végzik el.