Kutatás2026. ápr. 24.frissítve: 12:10

75%-os pontossággal jósolja az arab emoji-használatot az új MARBERT modell

A MARBERT modellt 11 379 arab tweetből álló korpuszon finomhangolták, hogy a szöveges bemenetek alapján előrejelezze az emoji-használatot.

Fotó: Tim Witzdam / Unsplash

forrás: ArXiv NLP·AI Forradalom szerk.·2026. április 24.

Megosztás

Gépi tanulással vizsgálták az emoji-használatot arab nyelvű tweetekben, a kutatás szerint a MARBERT modell 75%-os pontossággal képes előrejelezni az emojik megjelenését — írja az ArXiv NLP.

A kutatók egy 11 379 tweetből álló korpuszt gyűjtöttek össze a X.com (korábbi Twitter) platformról, amely több arab dialektust is reprezentál. A feldolgozás után 8695 tweetet használtak fel az elemzéshez, ezeket 14 különböző kategóriába sorolták, majd numerikusan kódolták a gépi tanulás számára.

A MARBERT modellt kifejezetten az emoji-használat előrejelzésére finomhangolták a szöveges bemenetek alapján. A modell teljesítményét precízió, visszahívás és F1-pontszámok alapján értékelték, az eredmények pedig ígéretesnek bizonyultak.

A tanulmány megállapításai szerint a modell összességében jól teljesített, bár a kutatók szerint további fejlesztésekre van szükség a gépi tanulási modellek, köztük a MARBERT teljesítményének javításához.

tetszett a cikk? oszd meg →

Megosztás