AgentWall: Új futásidejű védelmi réteg a lokális AI-ügynökök biztonságáért
Az új rendszer minden javasolt ügynökműveletet elfog, és explicit, deklaratív szabályok alapján értékeli, mielőtt az a gazdakörnyezetbe jutna.

Egyre kritikusabb problémaként azonosítják az autonóm AI-ügynökök biztonságát, különösen, ahogy a passzív szöveggenerátorokból aktív szereplőkké válnak, amelyek shell parancsokat hajthatnak végre, fájlokat módosíthatnak, API-kat hívhatnak meg és böngészhetnek a weben — írja az ArXiv-en megjelent tanulmány.
A nem biztonságos vagy támadólag manipulált viselkedés következményei azonnaliak és kézzelfoghatóak lehetnek. A meglévő AI-biztonsági munkák elsősorban a modellillesztésre és a bemeneti szűrésre összpontosítottak, de ezek a megközelítések nem foglalkoznak azzal, ami abban a pillanatban történik, amikor egy ügynök szándéka valós cselekvéssé válik egy gépen.
A biztonsági réteg hiányának árnyalatai
Ez a hiányosság különösen éles a lokális környezetekben, ahol a fejlesztők saját fájlrendszereik, hitelesítő adataik és infrastruktúrájuk ellen futtatnak ügynököket, kevés futásidejű kontrollal.
Védelmi vonalak a lokális AI-ügynökök számára
A Microsoft Security Blog szerint az AI-ügynökök védelmének egyik kulcsfontosságú eleme a biztonsági rendszer réteg, amely futásidejű védelmet, például tartalom szűrést és naplózást biztosít. A Google Cloud Gemini Enterprise Agent Platformja, a Model Armor is hasonlóan a futásidejű védelemre fókuszál, például a prompt injekciók és az érzékeny adatok kiszivárgása ellen. Az AgentWall rendszer 2024. március 15-én lesz elérhető a fejlesztők számára.