Frissítve: 16 perce·Ma: 57
Kutatás
AI által generált szöveg

Új finomhangolási módszerrel javulhat a Qwen3-8B érvelési képessége

A mesterséges intelligencia modellek finomhangolása során gyakran romlik a teljesítmény, ha a tanító modell stílusa eltér a tanulóétól, de egy új módszer orvosolhatja ezt a problémát.

Új finomhangolási módszerrel javulhat a Qwen3-8B érvelési képessége
Fotó: Homa Appliances / Unsplash
Forrás: ArXiv NLPSzerző: AI Forradalom szerk.
Megosztás

Jelentős stílusbeli eltérések okozták eddig a problémát a szintetikus adatokkal történő modellbetanításnál, ami gyakran rontotta, ahelyett, hogy javította volna az érvelési képességeket — írja az ArXiv NLP.

A kutatók most egy új keretrendszert, a TESSY-t (Teacher-Student Cooperation Data Synthesis framework) javasolják, amely áthidalja ezt a szakadékot. A TESSY a tanító és a tanuló modelleket felváltva használja a stílus- és nem-stílus tokenek generálására.

Ennek eredményeként a TESSY olyan szintetikus adatsorokat hoz létre, amelyek öröklik a tanító modell fejlett érvelési képességeit, miközben fenntartják a stílusbeli konzisztenciát a tanuló modell eloszlásával.

Kísérletek során a GPT-OSS-120B tanító modellként való használatával, a Qwen3-8B finomhangolása jelentős javulást mutatott a kódgenerálásban.

Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom