A DeepSeek R1 40%-kal múlja felül elődeit a benchmarkokon
A DeepSeek R1 modell 128K token kontextusablakkal rendelkezik, szemben a Google Gemma 4 31B 262K-s ablakával.

A DeepSeek R1 modell jelentősen, egyes benchmarkokon több mint 40%-kal múlja felül korábbi verzióit, mint például a V3-at — derült ki a DeepSeek V3.1 kiadásakor, írja a Wikipedia.
A DeepSeek V3.1, amelyet 2025. augusztus 21-én mutattak be MIT licenc alatt, hibrid architektúrával rendelkezik. Ez az új felépítés gondolkodó és nem gondolkodó módokat is magában foglal, ami hozzájárul a modell teljesítményéhez.
A gondolatok fonalán
A R1 a vezető modellek, így az O3 és a Gemini 2.5 Pro teljesítményét is megközelíti — írja a library. A modell képességeit többek között a SWE-bench és a Terminal-bench teszteken mérték.
Teljesítmény csúcson
A DeepSeek R1 modell 128K token kontextusablakkal rendelkezik, szemben a Google Gemma 4 31B 262K-s ablakával, és a SWE-bench teszten 2025. szeptember 1-jén érte el a legjobb eredményt.