Frissítve: 15 perce·Ma: 49
Modellek & LLM
AI által generált szöveg

A DeepSeek R1 40%-kal múlja felül elődeit a benchmarkokon

A DeepSeek R1 modell 128K token kontextusablakkal rendelkezik, szemben a Google Gemma 4 31B 262K-s ablakával.

A DeepSeek R1 40%-kal múlja felül elődeit a benchmarkokon
Fotó: Willian Justen de Vasconcellos / Unsplash
Forrás: Reddit LocalLLaMASzerző: AI Forradalom szerk.
Megosztás

A DeepSeek R1 modell jelentősen, egyes benchmarkokon több mint 40%-kal múlja felül korábbi verzióit, mint például a V3-at — derült ki a DeepSeek V3.1 kiadásakor, írja a Wikipedia.

A DeepSeek V3.1, amelyet 2025. augusztus 21-én mutattak be MIT licenc alatt, hibrid architektúrával rendelkezik. Ez az új felépítés gondolkodó és nem gondolkodó módokat is magában foglal, ami hozzájárul a modell teljesítményéhez.

A gondolatok fonalán

A R1 a vezető modellek, így az O3 és a Gemini 2.5 Pro teljesítményét is megközelíti — írja a library. A modell képességeit többek között a SWE-bench és a Terminal-bench teszteken mérték.

Teljesítmény csúcson

A DeepSeek R1 modell 128K token kontextusablakkal rendelkezik, szemben a Google Gemma 4 31B 262K-s ablakával, és a SWE-bench teszten 2025. szeptember 1-jén érte el a legjobb eredményt.

Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom