ÉlőUtoljára: 9 perceMa: 5
Modellek & LLMfrissítve: 08:10

DeepSeek V4-et adott ki a kínai cég — 1M token kontextussal és MoE skálázással

A modell hibrid és tömörített figyelmi mechanizmusokkal éri el a hatalmas kontextusablakot, és már elérhető webes, applikációs és API-felületeken is.

DeepSeek V4-et adott ki a kínai cég — 1M token kontextussal és MoE skálázással
Fotó: Fotó: Vitaly Sacred / Unsplash
forrás: Last Week in AI·AI Forradalom szerk.·
Megosztás

Nyílt forráskódú DeepSeek V4-es modelljét mutatta be a kínai DeepSeek, amely MoE (Mixture of Experts) skálázással és 1 millió tokenes kontextusablakkal érkezik — írja a Last Week in AI podcast összefoglalója.

A DeepSeek V4 két változatban, Pro és Flash kiadásban is elérhető. A hatalmas kontextusablakot a modell hibrid és tömörített figyelmi mechanizmusok kombinációjával valósítja meg, ami jelentős előrelépést jelent a hosszú szövegek kezelésében.

A DeepSeek V4 kiadása a kínai AI-verseny fokozódását jelzi, miközben a Tencent is bemutatta Hunyuan 3 előzetesét, ami azonban gyengébb teljesítményteszt eredményeket produkált.

Az új modell már elérhető webes felületen, mobilapplikáción és API-n keresztül is, így a fejlesztők és felhasználók széles köre számára hozzáférhetővé válik a DeepSeek V4 képessége.

tetszett a cikk? oszd meg →
Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom