ÉlőUtoljára: 12 perceMa: 26
Modellek & LLMfrissítve: 07:10

31 nyelven szólal meg a Supertonic v3 – kevesebb olvasási hibával dolgozik

Az új, ONNX-alapú rendszer 99 millió paraméterrel működik, és a korábbi 5 nyelv helyett már 31 ISO nyelvkódot ismer, köztük a magyart is.

31 nyelven szólal meg a Supertonic v3 – kevesebb olvasási hibával dolgozik
Fotó: Fotó: Steve A Johnson / Unsplash
forrás: MarkTechPost·AI Forradalom szerk.·
Megosztás

Megjelent a Supertone Supertonic v3, a cég eszközön futó, ONNX-alapú szövegfelolvasó rendszerének harmadik generációja — írja a MarkTechPost. A modell jelentősen javult az előző verzióhoz képest, kevesebb ismétlési és kihagyási hibával dolgozik, és pontosabb hangzást biztosít.

A Supertonic 3 egyik legnagyobb újdonsága a nyelvi támogatás bővítése: a korábbi angol, koreai, spanyol, portugál és francia mellett immár 31 nyelven képes szöveget felolvasni. Az újonnan hozzáadott nyelvek között szerepel a japán, arab, német, orosz, török, vietnámi, és a magyar is.

A hangzás szőttese

A v3-as verzió emellett kifejező tag-eket is támogat, mint például a <laugh>, <breath> és <sigh>. Ezekkel a fejlesztők közvetlenül a bemeneti szövegbe ágyazhatnak prozódiai jeleket, külön előfeldolgozási lépés vagy expresszivitásért felelős modell nélkül.

Hangalapú felületek

A Supertonic 3 futásidejű hatékonysága is kiemelkedő: CPU-n is gyorsan működik, és lényegesen kevesebb memóriát használ, mint nagyobb alapmodellek, amelyek A100 GPU-t igényelnek. A rendszer átlagosan 0,3x RTF-et ér el egy Onyx Boox Go 6 e-olvasón repülőgép üzemmódban. A Supertone Voice Builder szolgáltatása 404 MB lemezterületet foglal.

tetszett a cikk? oszd meg →
Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom