Frissítve: 25 perce·Ma: 51
Modellek & LLM
AI által generált szöveg

Az Anthropic Claude Opus 4.7-je 64,3%-ra ugrott a kódolási teljesítményteszten

A frissített modell a SWE-bench Pro kódolási teljesítményteszten 64,3 százalékos eredményt ért el, ami jelentős javulás az elődjéhez képest.

Az Anthropic Claude Opus 4.7-je 64,3%-ra ugrott a kódolási teljesítményteszten
Fotó: Alexander Sinn / Unsplash
Forrás: The DecoderSzerző: AI Forradalom szerk.
Megosztás

Jelentős előrelépést tett az Anthropic új zászlóshajó modellje, a Claude Opus 4.7 az autonóm kódolás terén — írja a The Decoder.

A Claude Opus 4.7 a SWE-bench Pro kódolási teljesítményteszten 64,3 százalékot ért el, szemben az előző Opus 4.6 53,4 százalékával. Ezzel az eredménnyel még az OpenAI GPT-5.4-es modelljét is megelőzi, amely 57,7 százalékot produkált. Az Anthropic saját, még fejlesztés alatt álló Claude Mythos Preview modellje továbbra is vezet 77,8 százalékkal.

A kódolás új dimenziói

Az Opus 4.7 képfeldolgozási képességei is jelentősen javultak: akár 2576 pixeles felbontású képeket is képes feldolgozni, ami körülbelül 3,75 megapixelt jelent. Ez több mint háromszorosa annak, amit a korábbi Claude modellek kezelni tudtak. A vállalat szerint ez nagy előnyt jelent a sűrű képernyőképeket elemző és komplex diagramokból adatokat kinyerő számítógépes ügynökök számára.

Kibervédelmi egyensúly

Érdekes fordulat, hogy az Anthropic szándékosan korlátozta a modell kibervédelmi képességeit. A cég kísérleti jelleggel próbálta csökkenteni a kockázatos kibervédelmi funkciókat a betanítás során, és automatikusan blokkolja a tiltott vagy magas kockázatú felhasználásra utaló kéréseket. Ez a stratégia a nemrég bejelentett Project Glasswing keretében valósul meg, amely az AI modellek kibervédelmi kockázataival és előnyeivel foglalkozik. Az Opus 4.7 az első tesztje ennek a megközelítésnek.

Bár a tokenenkénti árak változatlanok maradtak, az Opus 4.7 egy új tokent használ, amely ugyanazt a szöveget akár 35 százalékkal több tokenre is leképezheti. Ez azt jelenti, hogy a valós költségek jelentősen megemelkedhetnek egy-egy kérés esetén. Az Anthropic Claude Opus 4.7 modellje a Claude API-n, az Amazon Bedrockon, a Google Cloud Vertex AI-n és a Microsoft Foundry-n keresztül is elérhető 2024. március 15-től.

Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom