ÉlőUtoljára: 35 perceMa: 19
Modellek & LLMfrissítve: 08:30

Két nagyságrendet csökkent az AI a kínai nyelvtan-javításban — új módszerrel

Az új CSRP módszer 50.99 $F_{0.5}$-os eredménnyel új csúcsot állít fel a kínai nyelvtani hibajavításban, miközben 5.20 ponttal múlja felül a GPT-4-et a helyesírásban.

Két nagyságrendet csökkent az AI a kínai nyelvtan-javításban — új módszerrel
Fotó: Fotó: Growtika / Unsplash
forrás: ArXiv NLP·AI Forradalom szerk.·
Megosztás

A kínai nyelvtani hibajavító (CGEC) rendszerek fejlesztése két fő kihívással néz szembe: az általános modellekből hiányoznak a finom nyelvi különbségekhez szükséges speciális ismeretek, a felügyelt finomhangolás (SFT) pedig nem optimalizálja a precíziós metrikákat, ami túlzott javításokhoz vezet. A probléma megoldására a kutatók bemutatták a CSRP-t, egy új, háromlépcsős keretrendszert — írja az ArXiv NLP.

A CSRP először Continual Pre-training (CPT) fázison esik át 5.9 millió kiegyensúlyozott mintán, hogy elsajátítsa a doménspecifikus tudást. Ezt követi a Chain-of-Thought SFT, amely explicit hibakeresési folyamatot használ a diagnosztikai átláthatóság érdekében. Végül a Group Relative Policy Optimization, egy új, hatékonyságtudatos jutalmazási mechanizmussal, amely kifejezetten bünteti a felesleges módosításokat.

Kapcsolódó: LLM érvelési képessége

A nyelvtani hibajavítás új korszaka

A NACGEC teljesítményteszten a CSRP 50.99 $F_{0.5}$-os eredménnyel és 57.17-os precízióval teljesített, jelentősen felülmúlva a korábbi legjobb eredményeket, miközben hatékonyan csökkentette a Maximum Likelihood Estimation (MLE) által betanított modellek túlzott javítási tendenciáját.

Kapcsolódó: LLM mint bíró

Áttörés a helyesírás-javításban

A módszer a CSCD helyesírás-javítást is 59.61 F1-re emelte, ami 5.20 ponttal jobb a GPT-4 teljesítményénél. Az eredmények azt mutatják, hogy a reinforcement learning (RL) igazítási szakasz 8%-os relatív növekedést biztosít a SFT alapmodellhez képest, és ez a hatás független a nagyméretű CPT hozzájárulásától. A CSRP módszer a 2024. március 10-én publikált tanulmányban 50.99 $F_{0.5}$-os eredményt ért el.

Kapcsolódó: VPS-módszer

tetszett a cikk? oszd meg →
Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom