Kérdőjelek az Anthropic AI biztonsági ígéretei körül: nincs összehasonlító adat
Az Anthropic biztonsági állításait alátámasztó adatok hiányoznak, a független ellenőrzéshez szükséges információk nem állnak rendelkezésre.

Az Anthropic, az egyik vezető AI-fejlesztő cég, komoly biztonsági ígéreteket tesz modelljeivel kapcsolatban, de Dr. Heidy Khlaaf, az AI Now Institute vezető AI tudósa szerint ezeket nem támasztják alá megfelelő adatok — írja a The Observer.
Khlaaf, aki korábban az OpenAI biztonsági mérnöke is volt, aggodalmát fejezte ki, hogy az Anthropic nem szolgáltat összehasonlító adatokat a meglévő automatizált biztonsági eszközökkel, sem a téves riasztások arányát.
A szakértő szerint az Anthropic „biztonság az első” imázsa lehetővé teszi számukra, hogy igazolják a nyilvános kiadás hiányát, még korlátozott formában is, a független értékelés céljából. Ez azonban elhomályosítja a szakértők képességét, hogy függetlenül validálják az Anthropic állításait.
Khlaaf kritikája rávilágít arra, hogy a nagyméretű nyelvi modellek (LLM-ek) biztonságának értékelése továbbra is kihívást jelent, különösen, ha a fejlesztők nem tesznek közzé részletes összehasonlító adatokat. A transzparencia hiánya akadályozza a szélesebb szakértői közösséget abban, hogy objektíven felmérje az Anthropic által bevezetett biztonsági intézkedések hatékonyságát.
Az AI Now Institute vezető AI tudósa szerint a nyilvános adatok hiánya megnehezíti a biztonsági állítások független ellenőrzését, ami kulcsfontosságú lenne az Anthropic modelljeinek szélesebb körű elfogadásához.