384 ezer token kimenettel érkezik a DeepSeek V4 Flash és V4 Pro
A kínai startup a V4 Flash és V4 Pro modelleket a legerősebb nyílt forráskódú platformként pozicionálja, kihívást intézve az OpenAI és Anthropic felé.

Új zászlóshajó mesterséges intelligencia modelljeinek előzetes verzióit mutatta be a DeepSeek, egy évvel azután, hogy úttörő platformjával felrázta a Szilícium-völgyet — írja a Bloomberg.
A kínai startup, amely tavaly májusban a DeepSeek-V2 chatbot modellel vált ismertté, most a V4 Flash és V4 Pro modellekkel jelentkezett. Ezek a modellek akár 384 000 token kimeneti kapacitással is rendelkeznek, ami jelentős előrelépést jelent a szöveggenerálás és a kontextuskezelés terén.
A DeepSeek szerint az új modellek a legerősebb nyílt forráskódú platformot képviselik a piacon. A vállalat ezzel közvetlen kihívást intéz a zárt forráskódú óriások, mint az OpenAI és az Anthropic felé, hangsúlyozva a nyílt forráskódú AI fejlődését.
A DeepSeek a R1 modelljének betanítási költségeit is jelentősen csökkentette, többek között a Mixture of Experts (MoE) rétegek alkalmazásával. A vállalat a Kínára vonatkozó AI chip exportkorlátozások ellenére is képezte modelljeit, gyengébb, exportra szánt chipeket használva.
A DeepSeek V4 Flash és V4 Pro modellek előzetes verziói már elérhetők, a vállalat a részletes árképzésről és paraméterekről később ad tájékoztatást.