Frissítve: 15 perce·Ma: 50
Modellek & LLM
AI által generált szöveg

Anthropic: Túl veszélyes a Claude Mythos, de 12 cég már teszteli

Az Anthropic titokban fejlesztett Claude Mythos modellje a benchmarkokon jelentősen felülmúlja elődjét, az Opus 4.6-ot, ám a szoftveres sebezhetőségek kiaknázásában mutatott képességei miatt nem adják ki széles körben.

Anthropic: Túl veszélyes a Claude Mythos, de 12 cég már teszteli
Fotó: Guille B / Unsplash
Forrás: Ben's BitesSzerző: AI Forradalom szerk.
Megosztás

Túl veszélyesnek ítélte az Anthropic a következő generációs AI modelljét, a Claude Mythost, amely rendkívül hatékonyan talál és használ ki szoftveres sebezhetőségeket. A modell a Firefoxban végzett tesztek során 181 működő exploitot generált, míg az Opus csak kettőt — írja a Ben's Bites.

A Mythos képességei olyan kritikus szoftverprojektekben is évtizedes hibákat tártak fel, mint az OpenBSD (27 éves hiba) vagy a FFmpeg (16 éves hiba). Emiatt az Anthropic úgy döntött, hogy nem teszi nyilvánosan elérhetővé a modellt.

Ehelyett a vállalat 12 cégnek biztosít előzetes hozzáférést a Mythoshoz a „Project Glasswing” keretében. A program célja, hogy ezek a cégek a modell segítségével keressenek sebezhetőségeket saját kritikus szoftvereikben. Az Anthropic 100 millió dollár értékű modellhasználati kreditet és 4 millió dollár adományt is felajánl nyílt forráskódú biztonsági szervezeteknek a projekt részeként.

A biztonság szövőszéke

A benchmarkokon a Mythos jelentős előrelépést mutatott: a SWE-bench Pro teszten 53,4%-ról 77,8%-ra, a Terminal-Bench 2.0-n pedig 65,4%-ról 82%-ra javított az Opus 4.6-hoz képest. A modell teljesítményét Theo egy videóban úgy jellemezte: „A Mythos az Opushoz úgy viszonyul, mint az Opus a Sonnethez.”

A fejlődés fonalai

Az Anthropic a Project Glasswing keretében a Mythos segítségével a kritikus szoftverek biztonságának javítását tűzte ki célul, 2024. év végéig.

Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom