A Cohere Transcribe 5,42 százalékos átlagos szóhiba aránnyal vezeti a beszédfelismerési ranglistát
A Transcribe modell 2 milliárd paraméterrel és 14 nyelvet támogat, köztük angolt, németet, franciát és japánt.

Cohere, a kanadai AI vállalat, bejelentette új, nyílt forráskódú beszédfelismerő modelljét, a Transcribe-t. A 2 milliárd paraméterrel bíró rendszer 14 nyelvet támogat, köztük az angolt, németet, franciát és japánt. A Hugging Face Open ASR Leaderboard szerint a Transcribe 5,42 % -os átlagos szóhiba aránnyal (WER) vezet a ranglistán, ezzel felülmúlva a Whisper Large v3, Scribe v2 és Qwen3-ASR-1.7B modelleket.
Ez a teljesítmény a felhasználói élmény szempontjából jelentős előrelépést jelent. A 5,42 % WER azt jelzi, hogy a Transcribe képes a legtöbb szövegfelvételt nagy pontossággal átalakítani, ami különösen fontos ügyfélszolgálati, feliratkészítési és transzkripciós alkalmazásokban. A gyors feldolgozási sebesség, amely a modell a legnagyobb szintű modellek közül is kiemelkedik, lehetővé teszi valós idejű alkalmazásokat, mint például automatikus szövegírást vagy élő fordítást.
A technológiai részletek alapján a Transcribe egy 2 milliárd paraméteres architektúrát használ, amely többnyelvű támogatást biztosít anélkül, hogy kompromisszumot kellene kötni a pontosság vagy a sebesség terén. A modell a Hugging Face-en elérhető Apache 2.0 licenc alatt, így a fejlesztők szabadon letölthetik, módosíthatják és integrálhatják saját rendszereikbe. Cohere azt is jelzi, hogy a Transcribe-t a jövőben a saját AI ügynökplatformjába, a North-ba fogják beépíteni.
A versenykörnyezetben a Transcribe gyorsan szilárd helyet szerez. A Hugging Face Open ASR Leaderboardon a modell a leggyorsabb feldolgozást és a legkisebb WER-t kombinálja, ami a többi nagyobb modell, például a Whisper vagy a Scribe, nem éri el egyaránt. Ez a kombináció lehetővé teszi, hogy vállalatok, kutatók és fejlesztők egyetlen, hatékony megoldást találjanak a beszédfelismerésre.
A Transcribe most már letölthető a Hugging Face-ről, és elérhető Cohere API-n keresztül is. A következő hónapokban a vállalat a North platformba való integrációt tervezi, amely lehetővé teszi a fejlett ügynöki funkciók használatát a transzkripciós folyamatokban. A fejlesztők és a felhasználók számára érdemes figyelemmel kísérni a további frissítéseket és a modellel kapcsolatos közösségi visszajelzéseket.