Kiberbiztonsági tudásgráfokat épít a GRID — stabilabban, mint a LLM-ek
A nagyméretű nyelvi modellek (LLM-ek) gyakran hiányosak a kiberbiztonsági adatok értelmezésében, de a GRID (Graph Representation of Intelligence Data) rendszerrel ez megváltozhat.

Új végpontok közötti rendszert fejlesztettek ki kutatók a kiberbiztonsági szöveges tudásgráfok építésére, amely a nehezen feldolgozható kiberfenyegetési intelligencia (CTI) cikkekből is hatékonyan képes adatokat kinyerni — derül ki az arXiv-on előnyomtatott formában megjelent tanulmányból.
A GRID (Graph Representation of Intelligence Data) nevű megközelítés a biztonsági ügynökök számára számítógéppel feldolgozható külső memóriát biztosít. A CTI-cikkekből származó tudásgráfok felépítése eddig azért volt nehézkes, mert a LLM-eknek gyakran hiányzik a megalapozott biztonsági tartományismeret, és a dokumentumokból gráfokká történő végpontok közötti betanítást nehéz stabil jutalmazással felügyelni.
A kutatók az arXiv-on megjelent tanulmányban bemutatják, hogy a GRID rendszer hogyan képes a CTI-cikkekből hatékonyan kinyerni az adatokat, és ezzel stabilabb feladatspecifikus jutalmakat eredményez.
A kiberbiztonsági adatok feldolgozásának új korszaka
A GRID a biztonsági tartományra szabott felügyeletet úgy építi fel a CTI-cikkekből, hogy nyomon követhető cikk-gráf illesztéseket hoz létre gráfkinyerés és tudásgráf-kondicionált szövegjavítás révén. Ez a módszer a dokumentum-gráf tanulást egy szkriptelt feladatbankká alakítja, amely négyopciós, többszörös választású kérdéseket kombinál hármas szintű reguláris kifejezés-illesztési célokkal.
A GRID rendszer hatékonysága
A kutatók ezzel a felügyeleti folyamattal két Qwen3-4B-Inst modellt is betanítottak, amelyek pontosabban és megbízhatóbban dolgozhatják fel a kiberfenyegetési adatokat, mint a korábbi modellek. A Qwen3-4B-Inst modellek 2024. márciusában kerülnek bemutatásra a kiberbiztonsági konferencián.