Anthropic: Túl veszélyes a Claude Mythos, de 12 cég már teszteli
Az Anthropic titokban fejlesztett Claude Mythos modellje a benchmarkokon jelentősen felülmúlja elődjét, az Opus 4.6-ot, ám a szoftveres sebezhetőségek kiaknázásában mutatott képességei miatt nem adják ki széles körben.

Túl veszélyesnek ítélte az Anthropic a következő generációs AI modelljét, a Claude Mythost, amely rendkívül hatékonyan talál és használ ki szoftveres sebezhetőségeket. A modell a Firefoxban végzett tesztek során 181 működő exploitot generált, míg az Opus csak kettőt — írja a Ben's Bites.
A Mythos képességei olyan kritikus szoftverprojektekben is évtizedes hibákat tártak fel, mint az OpenBSD (27 éves hiba) vagy a FFmpeg (16 éves hiba). Emiatt az Anthropic úgy döntött, hogy nem teszi nyilvánosan elérhetővé a modellt.
Ehelyett a vállalat 12 cégnek biztosít előzetes hozzáférést a Mythoshoz a „Project Glasswing” keretében. A program célja, hogy ezek a cégek a modell segítségével keressenek sebezhetőségeket saját kritikus szoftvereikben. Az Anthropic 100 millió dollár értékű modellhasználati kreditet és 4 millió dollár adományt is felajánl nyílt forráskódú biztonsági szervezeteknek a projekt részeként.
A biztonság szövőszéke
A benchmarkokon a Mythos jelentős előrelépést mutatott: a SWE-bench Pro teszten 53,4%-ról 77,8%-ra, a Terminal-Bench 2.0-n pedig 65,4%-ról 82%-ra javított az Opus 4.6-hoz képest. A modell teljesítményét Theo egy videóban úgy jellemezte: „A Mythos az Opushoz úgy viszonyul, mint az Opus a Sonnethez.”
A fejlődés fonalai
Az Anthropic a Project Glasswing keretében a Mythos segítségével a kritikus szoftverek biztonságának javítását tűzte ki célul, 2024. év végéig.