ÉlőUtoljára: 35 perceMa: 0
Biztonságfrissítve: 11:10

Kérdőjelek az Anthropic AI biztonsági ígéretei körül: nincs összehasonlító adat

Az Anthropic biztonsági állításait alátámasztó adatok hiányoznak, a független ellenőrzéshez szükséges információk nem állnak rendelkezésre.

Kérdőjelek az Anthropic AI biztonsági ígéretei körül: nincs összehasonlító adat
Fotó: Fotó: Benjamin Lotterer / Unsplash
forrás: AI Now Institute·AI Forradalom szerk.·
Megosztás

Az Anthropic, az egyik vezető AI-fejlesztő cég, komoly biztonsági ígéreteket tesz modelljeivel kapcsolatban, de Dr. Heidy Khlaaf, az AI Now Institute vezető AI tudósa szerint ezeket nem támasztják alá megfelelő adatok — írja a The Observer.

Khlaaf, aki korábban az OpenAI biztonsági mérnöke is volt, aggodalmát fejezte ki, hogy az Anthropic nem szolgáltat összehasonlító adatokat a meglévő automatizált biztonsági eszközökkel, sem a téves riasztások arányát.

A szakértő szerint az Anthropic „biztonság az első” imázsa lehetővé teszi számukra, hogy igazolják a nyilvános kiadás hiányát, még korlátozott formában is, a független értékelés céljából. Ez azonban elhomályosítja a szakértők képességét, hogy függetlenül validálják az Anthropic állításait.

Khlaaf kritikája rávilágít arra, hogy a nagyméretű nyelvi modellek (LLM-ek) biztonságának értékelése továbbra is kihívást jelent, különösen, ha a fejlesztők nem tesznek közzé részletes összehasonlító adatokat. A transzparencia hiánya akadályozza a szélesebb szakértői közösséget abban, hogy objektíven felmérje az Anthropic által bevezetett biztonsági intézkedések hatékonyságát.

Az AI Now Institute vezető AI tudósa szerint a nyilvános adatok hiánya megnehezíti a biztonsági állítások független ellenőrzését, ami kulcsfontosságú lenne az Anthropic modelljeinek szélesebb körű elfogadásához.

tetszett a cikk? oszd meg →
Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom