Modellek & LLM2026. ápr. 16.frissítve: 19:30

Az Anthropic Claude Opus 4.7-tel tér vissza a csúcsra, szűken megelőzve riválisait

Az Anthropic ma tette közzé a Claude Opus 4.7-et, amely ügynöki kódolásban és pénzügyi elemzésben is felülmúlja az OpenAI GPT-5.4 és a Google Gemini 3.1 Pro modelljeit.

Fotó: Vishnu Mohanan / Unsplash

forrás: VentureBeat·AI Forradalom szerk.·2026. április 16.

Megosztás

Nyilvánosan is elérhetővé tette legújabb, Claude Opus 4.7 nevű nagyméretű nyelvi modelljét az Anthropic — írja a VentureBeat. A modell több kulcsfontosságú teljesítményteszten is felülmúlja legfőbb riválisait, köztük az OpenAI GPT-5.4-et és a Google Gemini 3.1 Pro-t.

Az Opus 4.7 az úgynevezett GDPVal-AA tudásmunka értékelésen 1753-as Elo pontszámmal vezeti a piacot, ezzel megelőzve a GPT-5.4 (1674) és a Gemini 3.1 Pro (1314) eredményeit. Fontos azonban, hogy a modell nem minden kategóriában nyújt kiemelkedő teljesítményt; az ügynöki keresésben, a többnyelvű Q&A-ban és a terminálalapú kódolásban továbbra is a versenytársak vezetnek.

A fejlettebb nyelvi feldolgozás csúcspontja

Az Opus 4.7 az Opus 4.6 architektúrájának közvetlen továbbfejlesztése, de teljesítménybeli különbségei leginkább a szoftverfejlesztésben és az összetett dokumentumelemzésben mutatkoznak meg. A modell új képessége, hogy feladatok befejezése előtt saját ellenőrzési lépéseket dolgoz ki, ezzel csökkentve a „hallucinációkat”. Például belső teszteken a modell egy Rust-alapú szövegfelolvasó motort épített, majd önállóan ellenőrizte a generált hangot egy Python referencia alapján.

Jelentős építészeti újítás a nagy felbontású multimodális támogatás bevezetése. Az Opus 4.7 akár 2576 pixeles képeket is képes feldolgozni a leghosszabb élükön, ami körülbelül 3,75 megapixelt jelent. Ez háromszoros felbontásnövekedést jelent az előző verziókhoz képest. A XBOW benchmarkokon a modell 54,5%-ról 98,5%-ra javította a vizuális élességi tesztek sikerességi arányát.

A költséghatékony működés új stratégiája

Az Anthropic egy új „erőfeszítés” paramétert vezet be, amely lehetővé teszi a felhasználók számára, hogy finomabban szabályozzák a modell gondolkodási mélységét. Az API-ban megjelennek a „feladatköltségvetések” is, amelyekkel a fejlesztők kemény korlátot állíthatnak be az autonóm ügynökök tokenfelhasználására, elkerülve a váratlan számlákat. Az Anthropic emellett bevezeti a Cyber Verification Programot is, amely lehetővé teszi a jogosult szakemberek számára, hogy hozzáférjenek az Opus 4.7 képességeihez védelmi célokra, 2024. év végéig.

tetszett a cikk? oszd meg →

Megosztás