Modellek & LLM2026. ápr. 6.frissítve: 10:10

A DeepSeek R1 40%-kal múlja felül elődeit a benchmarkokon

A DeepSeek R1 modell 128K token kontextusablakkal rendelkezik, szemben a Google Gemma 4 31B 262K-s ablakával.

Fotó: Jeffrey Zhang / Unsplash

forrás: Reddit LocalLLaMA·AI Forradalom szerk.·2026. április 6.

Megosztás

A DeepSeek R1 modell jelentősen, egyes benchmarkokon több mint 40%-kal múlja felül korábbi verzióit, mint például a V3-at — derült ki a DeepSeek V3.1 kiadásakor, írja a Wikipedia.

A DeepSeek V3.1, amelyet 2025. augusztus 21-én mutattak be MIT licenc alatt, hibrid architektúrával rendelkezik. Ez az új felépítés gondolkodó és nem gondolkodó módokat is magában foglal, ami hozzájárul a modell teljesítményéhez.

A gondolatok fonalán

A R1 a vezető modellek, így az O3 és a Gemini 2.5 Pro teljesítményét is megközelíti — írja a library. A modell képességeit többek között a SWE-bench és a Terminal-bench teszteken mérték.

Teljesítmény csúcson

A DeepSeek R1 modell 128K token kontextusablakkal rendelkezik, szemben a Google Gemma 4 31B 262K-s ablakával, és a SWE-bench teszten 2025. szeptember 1-jén érte el a legjobb eredményt.

tetszett a cikk? oszd meg →

Megosztás