Frissítve: 5 perce·Ma: 27
Kutatás
AI által generált szöveg

1500 videómintát tartalmaz az új SyriSign adathalmaz a szíriai arab jelnyelv fordításához

A SyriSign adathalmaz fejlesztésében 20 kutató vett részt, akik 6 hónapon keresztül dolgoztak a projektön

1500 videómintát tartalmaz az új SyriSign adathalmaz a szíriai arab jelnyelv fordításához
Fotó: Chase Chappell / Unsplash
Forrás: ArXiv NLPSzerző: AI Forradalom szerk.
Megosztás

Az új SyriSign adatbázis 1500 videót tartalmaz, mely 150 egyedi szíriai arab jelnyelvi jelet reprezentál. A projektben 20 kutató dolgozott, akik hat hónapig összpontosítottak a szíriai arab jelnyelv (SyArSL) nyelvi adatgyűjtésére.

Szíriában a legtöbb hírt és információt szóban vagy írott arab nyelven közlik, ami a sikertelenül hallható közösség számára jelentős kommunikációs akadályt jelent. A SyriSign célja, hogy ezeket a korlátokat enyhítse, és lehetővé tegye a jelnyelvi fordítások fejlesztését.

A kutatók a datasetet három mélytanulási architektúrával vizsgálták: a MotionCLIP-et a szemantikus mozgás generálására, a T2M‑GPT-t szöveg‑alapú mozgás szintéziséhez, valamint a SignCLIP-et a kettős nyelvi beágyazási illesztéshez. A tesztek erőteljes potenciált mutattak a generatív megközelítésekben.

Az új adatbázis elősegíti a szíriai arab jelnyelvi technológiák kutatását, és kitölti a nyelvi erőforrások hiányát, amely korábban csak magas erőforrású jelnyelvekhez tartozott.

A következő lépés a SyriSign alapján készült modellek továbbfejlesztése, hogy valós idejű, pontos jelnyelvi fordításokat nyújtsanak a szíriai DHH közösség számára.

Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom