Az OpenAI Model Spec: egy nyilvános keret az AI-viselkedéshez
Az OpenAI a Model Spec mellett egy új, kollektív igazodási folyamatot is indított, amelyben a nyilvánosság segíthet az AI-viselkedés formálásában.
Az OpenAI a Model Spec mellett egy új, kollektív igazodási folyamatot is indított, amelyben a nyilvánosság segíthet az AI-viselkedés formálásában. A Model Spec egy nyilvános keret, amely meghatározza, hogyan kell a modelleknek követniük a felhasználói utasításokat, miként kell konfliktusokat rendezniük és milyen biztonsági határokat kell betartani.
A dokumentum három fő célkitűzést fogalmaz meg: (1) iteratív modellek telepítése, amelyek fejlesztőket és felhasználókat erősítenek, (2) a súlyos károk megelőzése, és (3) OpenAI működési engedélyének fenntartása. Ezeket a célokat a Model Spec előszója részletesen kifejti, és segít a modellek számára, hogy a magasabb szintű irányelveket elsőbbségbe helyezzék.
A Chain of Command a Model Spec központi eleme. Itt határozzák meg az irányelvek határozatárát: a modelleknek a legmagasabb hatalomú utasításokhoz kell igazodniuk. Például, ha egy felhasználó bombát készít, a biztonsági határok (hard safety boundaries) kerülnek előtérbe, míg a „robbantás” kérés alacsonyabb hatalomú, ezért a biztonságos viselkedés kerül előtérbe.
Az OpenAI a Model Spec-et 2024-ben vezette be, és azóta folyamatosan frissíti a felhasználói visszajelzések és a modellek tényleges teljesítménye alapján. A frissítések részeként a cég bevezetett egy kollektív igazodási folyamatot, amely lehetővé teszi a közönség számára, hogy közvetlenül befolyásolja a modellek viselkedését és a szabályokat.
A Model Spec nem csak belső iránytű a fejlesztőknek, hanem egy nyilvános referencia pont, amely segíti a felhasználókat és a kutatóközösséget abban, hogy megértsék, milyen elveken alapul az AI viselkedése, és hogyan lehet a modelleket javítani.