Közvetett prompt injekcióval fegyverzik fel az AI-t a kiberbűnözők
A kiberbűnözők felhasználói interakció nélkül fegyverzik fel a mesterséges intelligenciát, hogy adatokat szivárogtassanak ki, kódot futtassanak vagy rosszindulatú oldalakra irányítsanak át.

A mesterséges intelligencia (AI) mindennapi alkalmazásokba való integrálása új lehetőségeket nyitott meg a visszaélésekre. Bár az AI-val kapcsolatos fenyegetések teljes köre még nem ismert, a közvetett prompt injekciós támadások komoly aggodalmat keltenek a fejlesztők és a biztonsági szakemberek körében — írja a ZDNET.
A közvetett prompt injekció akkor fordul elő, amikor rosszindulatú utasításokat rejtenek el olyan szövegekben, mint például weboldalak tartalma vagy internetes címek, amelyeket egy nagyméretű nyelvi modell (LLM) dolgoz fel. Ha egy AI chatbot e-mail vagy közösségi média szolgáltatásokhoz kapcsolódik, ezek a rosszindulatú utasítások ott is elrejthetők.
Az árnyékban megbújó fenyegetés
Ezek a támadások különösen veszélyesek, mert nem igényelnek felhasználói interakciót. A LLM elolvashatja és végrehajthatja a rosszindulatú utasítást, majd kártékony tartalmat jeleníthet meg, például csaló weboldalak címeit, adathalász linkeket vagy félretájékoztatást. A Microsoft figyelmeztetése szerint a közvetett prompt injekciós támadások gyakran kapcsolódnak adatszivárgáshoz és távoli kódfuttatáshoz.
A közvetlen prompt injekcióval ellentétben – ahol a támadó közvetlenül a rendszernek adja ki a rosszindulatú utasítást – a közvetett támadások rejtve maradnak a feldolgozott adatokban. Az OWASP Foundation, amely a webes alkalmazások legkiemelkedőbb biztonsági fenyegetéseit rangsorolja, a prompt injekciót – mind a közvetlen, mind a közvetett formáját – a LLM-biztonság legnagyobb fenyegetésének tekinti.
A rejtett veszélyek feltárása
Valós példák is alátámasztják a fenyegetés súlyosságát. A Palo Alto Networks Unit 42 tanácsadója arra figyelmeztetett, hogy a LLM-ek nem tudják megkülönböztetni a legitim tartalmat a rosszindulatú utasításoktól. A Forcepoint kutatói olyan kifinomult támadásokat dokumentáltak, amelyek API-kulcsok ellopására, rendszerfelülírásra vagy akár terminálparancsok injektálására is alkalmasak.
A védekezés alapvető módszerei közé tartozik a bemeneti és kimeneti adatok validálása és szanálása, az emberi felügyelet bevezetése a LLM viselkedésében, a legkevesebb jogosultság elvének alkalmazása és a gyanús viselkedésre figyelmeztető riasztások beállítása. A Google szerint a prompt injekciós támadások nem tűnnek el egyhamar, a 2024-es évben várhatóan további fejlemények lesznek a támadások és a védelmi módszerek terén.