Az Anthropic Claude Opus 4.7-je 64,3%-ra ugrott a kódolási teljesítményteszten
A frissített modell a SWE-bench Pro kódolási teljesítményteszten 64,3 százalékos eredményt ért el, ami jelentős javulás az elődjéhez képest.

Jelentős előrelépést tett az Anthropic új zászlóshajó modellje, a Claude Opus 4.7 az autonóm kódolás terén — írja a The Decoder.
A Claude Opus 4.7 a SWE-bench Pro kódolási teljesítményteszten 64,3 százalékot ért el, szemben az előző Opus 4.6 53,4 százalékával. Ezzel az eredménnyel még az OpenAI GPT-5.4-es modelljét is megelőzi, amely 57,7 százalékot produkált. Az Anthropic saját, még fejlesztés alatt álló Claude Mythos Preview modellje továbbra is vezet 77,8 százalékkal.
A kódolás új dimenziói
Az Opus 4.7 képfeldolgozási képességei is jelentősen javultak: akár 2576 pixeles felbontású képeket is képes feldolgozni, ami körülbelül 3,75 megapixelt jelent. Ez több mint háromszorosa annak, amit a korábbi Claude modellek kezelni tudtak. A vállalat szerint ez nagy előnyt jelent a sűrű képernyőképeket elemző és komplex diagramokból adatokat kinyerő számítógépes ügynökök számára.
Kibervédelmi egyensúly
Érdekes fordulat, hogy az Anthropic szándékosan korlátozta a modell kibervédelmi képességeit. A cég kísérleti jelleggel próbálta csökkenteni a kockázatos kibervédelmi funkciókat a betanítás során, és automatikusan blokkolja a tiltott vagy magas kockázatú felhasználásra utaló kéréseket. Ez a stratégia a nemrég bejelentett Project Glasswing keretében valósul meg, amely az AI modellek kibervédelmi kockázataival és előnyeivel foglalkozik. Az Opus 4.7 az első tesztje ennek a megközelítésnek.
Bár a tokenenkénti árak változatlanok maradtak, az Opus 4.7 egy új tokent használ, amely ugyanazt a szöveget akár 35 százalékkal több tokenre is leképezheti. Ez azt jelenti, hogy a valós költségek jelentősen megemelkedhetnek egy-egy kérés esetén. Az Anthropic Claude Opus 4.7 modellje a Claude API-n, az Amazon Bedrockon, a Google Cloud Vertex AI-n és a Microsoft Foundry-n keresztül is elérhető 2024. március 15-től.