Frissítve: 2 órája·Ma: 0
Modellek & LLM
AI által generált szöveg

384 ezer token kimenettel érkezik a DeepSeek V4 Flash és V4 Pro

A kínai startup a V4 Flash és V4 Pro modelleket a legerősebb nyílt forráskódú platformként pozicionálja, kihívást intézve az OpenAI és Anthropic felé.

384 ezer token kimenettel érkezik a DeepSeek V4 Flash és V4 Pro
Fotó: Igor Omilaev / Unsplash
Forrás: Bloomberg TechnologySzerző: AI Forradalom szerk.
Megosztás

Új zászlóshajó mesterséges intelligencia modelljeinek előzetes verzióit mutatta be a DeepSeek, egy évvel azután, hogy úttörő platformjával felrázta a Szilícium-völgyet — írja a Bloomberg.

A kínai startup, amely tavaly májusban a DeepSeek-V2 chatbot modellel vált ismertté, most a V4 Flash és V4 Pro modellekkel jelentkezett. Ezek a modellek akár 384 000 token kimeneti kapacitással is rendelkeznek, ami jelentős előrelépést jelent a szöveggenerálás és a kontextuskezelés terén.

A DeepSeek szerint az új modellek a legerősebb nyílt forráskódú platformot képviselik a piacon. A vállalat ezzel közvetlen kihívást intéz a zárt forráskódú óriások, mint az OpenAI és az Anthropic felé, hangsúlyozva a nyílt forráskódú AI fejlődését.

A DeepSeek a R1 modelljének betanítási költségeit is jelentősen csökkentette, többek között a Mixture of Experts (MoE) rétegek alkalmazásával. A vállalat a Kínára vonatkozó AI chip exportkorlátozások ellenére is képezte modelljeit, gyengébb, exportra szánt chipeket használva.

A DeepSeek V4 Flash és V4 Pro modellek előzetes verziói már elérhetők, a vállalat a részletes árképzésről és paraméterekről később ad tájékoztatást.

Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom