ÉlőUtoljára: 1 órájaMa: 1
Eszközökfrissítve: 22:30

Microsoft bemutatja az ASSERT keretrendszert az AI viselkedés tesztelésére

Az ASSERT nevű nyílt forráskódú keretrendszerrel a fejlesztők egyszerűen hozhatnak létre AI viselkedéstesztet, szöveges célleírások alapján.

Microsoft bemutatja az ASSERT keretrendszert az AI viselkedés tesztelésére
Fotó: Fotó: Gabriel Vasiliu / Unsplash
forrás: TechCrunch·AI Forradalom szerk.·
Megosztás

A Microsoft kedden bemutatta az ASSERT nevű, nyílt forráskódú keretrendszerét, amely megkönnyíti az AI-modellek specifikus viselkedésének tesztelését. A fejlesztők magas szintű, természetes nyelvű leírásokat adhatnak meg a rendszernek, amely ezekből kidolgozott, pontozott teszteket generál.

Az ASSERT képes a megadott célokat, szabályokat és szándékolt viselkedéseket strukturált tesztesetekké alakítani. A rendszer futtatja ezeket a teszteket a cél-AI ellen, pontozza az eredményeket, és rögzíti a modell által követett utakat, beleértve a köztes lépéseket és a használt eszközöket.

Kapcsolódó: Euphony eszköz

A tesztelés mélyvízében

A keretrendszer kitölti azt az űrt, amelyet a szélesebb körű, általános értékelések nem tudnak lefedni, különösen akkor, amikor az AI-modelleknek egy adott alkalmazás vagy termék kontextusához, szabályaihoz és eszközeihez kell igazodniuk. „Az értékelések kritikusak a jó döntések meghozatalában” — mondta Sarah Bird, a Microsoft Responsible AI részlegének vezetője.

Kapcsolódó: AI-ügynök biztonság

Fejlesztés és monitorozás

Az ASSERT használható a rendszerek fejlesztése során, bevezetés után, sőt folyamatos monitorozásra is. A Microsoft szerint a keretrendszer 200 MB memóriával is képes dolgozni, miközben megőrzi a tesztek pontosságát. A Microsoft ASSERT keretrendszert 2024. március 15-én kezdte el alkalmazni saját fejlesztéseiben.

Kapcsolódó: új AI modellek

tetszett a cikk? oszd meg →
Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom