Modellek & LLM2026. ápr. 16.frissítve: 19:50

Az Anthropic Claude Opus 4.7-je 64,3%-ra ugrott a kódolási teljesítményteszten

A frissített modell a SWE-bench Pro kódolási teljesítményteszten 64,3 százalékos eredményt ért el, ami jelentős javulás az elődjéhez képest.

Fotó: Alexander Sinn / Unsplash

forrás: The Decoder·AI Forradalom szerk.·2026. április 16.

Megosztás

Jelentős előrelépést tett az Anthropic új zászlóshajó modellje, a Claude Opus 4.7 az autonóm kódolás terén — írja a The Decoder.

A Claude Opus 4.7 a SWE-bench Pro kódolási teljesítményteszten 64,3 százalékot ért el, szemben az előző Opus 4.6 53,4 százalékával. Ezzel az eredménnyel még az OpenAI GPT-5.4-es modelljét is megelőzi, amely 57,7 százalékot produkált. Az Anthropic saját, még fejlesztés alatt álló Claude Mythos Preview modellje továbbra is vezet 77,8 százalékkal.

A kódolás új dimenziói

Az Opus 4.7 képfeldolgozási képességei is jelentősen javultak: akár 2576 pixeles felbontású képeket is képes feldolgozni, ami körülbelül 3,75 megapixelt jelent. Ez több mint háromszorosa annak, amit a korábbi Claude modellek kezelni tudtak. A vállalat szerint ez nagy előnyt jelent a sűrű képernyőképeket elemző és komplex diagramokból adatokat kinyerő számítógépes ügynökök számára.

Kibervédelmi egyensúly

Érdekes fordulat, hogy az Anthropic szándékosan korlátozta a modell kibervédelmi képességeit. A cég kísérleti jelleggel próbálta csökkenteni a kockázatos kibervédelmi funkciókat a betanítás során, és automatikusan blokkolja a tiltott vagy magas kockázatú felhasználásra utaló kéréseket. Ez a stratégia a nemrég bejelentett Project Glasswing keretében valósul meg, amely az AI modellek kibervédelmi kockázataival és előnyeivel foglalkozik. Az Opus 4.7 az első tesztje ennek a megközelítésnek.

Bár a tokenenkénti árak változatlanok maradtak, az Opus 4.7 egy új tokent használ, amely ugyanazt a szöveget akár 35 százalékkal több tokenre is leképezheti. Ez azt jelenti, hogy a valós költségek jelentősen megemelkedhetnek egy-egy kérés esetén. Az Anthropic Claude Opus 4.7 modellje a Claude API-n, az Amazon Bedrockon, a Google Cloud Vertex AI-n és a Microsoft Foundry-n keresztül is elérhető 2024. március 15-től.

tetszett a cikk? oszd meg →

Megosztás