A GPT-5.5 felér a Mythos Preview kiberbiztonsági képességeivel — állítja az AISI
Az OpenAI GPT-5.5 modellje hasonló teljesítményszintet ért el a kiberbiztonsági teszteken, mint az Anthropic Mythos Preview-ja. A brit AI Security Institute (AISI) 2023 óta végzett tesztek alapján állapította meg ezt.

A brit AI Security Institute (AISI) új kutatása szerint az OpenAI GPT-5.5 modellje, amely a múlt héten vált nyilvánosan elérhetővé, a kiberbiztonsági értékeléseken „hasonló teljesítményszintet” ért el, mint az Anthropic korábban nagy hírveréssel beharangozott Mythos Preview modellje — írja az Ars Technica.
Az AISI 2023 óta 95 különböző Capture the Flag (CTF) kihívással teszteli a vezető AI-modellek kiberbiztonsági képességeit, többek között visszafejtés, webes kihasználás és kriptográfia terén. A legnehezebb „Expert” feladatokon a GPT-5.5 átlagosan 71,4 százalékos sikert ért el, ami valamivel magasabb, mint a Mythos Preview 68,6 százaléka, bár a hibahatáron belül van.
Egy különösen nehéz feladatban, amely egy Rust bináris dekódolásához szükséges disassembler építését foglalta magában, a GPT-5.5 mindössze 10 perc és 22 másodperc alatt oldotta meg a kihívást emberi segítség nélkül, 1,73 dolláros API-hívási költséggel — jegyzi meg az AISI.
A GPT-5.5 a „The Last Ones” (TLO) nevű AISI teszten is felér a Mythos Preview-hoz. Ez egy 32 lépéses adatkivonási támadást szimulál egy vállalati hálózaton. A GPT-5.5 tíz kísérletből háromszor járt sikerrel a TLO-n, szemben a Mythos Preview kettőjével. Korábban egyetlen modell sem tudta egyszer sem teljesíteni a tesztet.
Sam Altman, az OpenAI vezérigazgatója a Core Memory podcastnak adott interjúban „félelemalapú marketingnek” nevezte az egyes AI-modellek korlátozott kiadásait. Bár „biztos benne, hogy a Mythos nagyszerű modell a kiberbiztonságra”, hozzátette, hogy „egyértelműen hihetetlen marketing azt mondani: 'Építettünk egy bombát. Mindjárt a fejedre dobjuk. Eladunk neked egy bombabiztos óvóhelyet 100 millió dollárért.'”
Altman a közösségi médiában közölte, hogy a GPT-5.5-Cyber kezdeti kiadása is korlátozott lesz, és „a következő napokban kritikus kiberbiztonsági védők számára” lesz elérhető.