75%-os pontossággal jósolja az arab emoji-használatot az új MARBERT modell
A MARBERT modellt 11 379 arab tweetből álló korpuszon finomhangolták, hogy a szöveges bemenetek alapján előrejelezze az emoji-használatot.

Gépi tanulással vizsgálták az emoji-használatot arab nyelvű tweetekben, a kutatás szerint a MARBERT modell 75%-os pontossággal képes előrejelezni az emojik megjelenését — írja az ArXiv NLP.
A kutatók egy 11 379 tweetből álló korpuszt gyűjtöttek össze a X.com (korábbi Twitter) platformról, amely több arab dialektust is reprezentál. A feldolgozás után 8695 tweetet használtak fel az elemzéshez, ezeket 14 különböző kategóriába sorolták, majd numerikusan kódolták a gépi tanulás számára.
A MARBERT modellt kifejezetten az emoji-használat előrejelzésére finomhangolták a szöveges bemenetek alapján. A modell teljesítményét precízió, visszahívás és F1-pontszámok alapján értékelték, az eredmények pedig ígéretesnek bizonyultak.
A tanulmány megállapításai szerint a modell összességében jól teljesített, bár a kutatók szerint további fejlesztésekre van szükség a gépi tanulási modellek, köztük a MARBERT teljesítményének javításához.