Frissítve: 10 perce·Ma: 58
Kutatás
AI által generált szöveg

Az NVIDIA egy nap alatt képes domain-specifikus embedding modellt képezni

Az Atlassian 26%-os javulást ért el a Recall@60 értékben, miután finomhangolta a modellt a JIRA adathalmazon.

Az NVIDIA egy nap alatt képes domain-specifikus embedding modellt képezni
Fotó: Dimitri Karastelev / Unsplash
Forrás: Hugging FaceSzerző: AI Forradalom szerk.
Megosztás

Az NVIDIA bemutatott egy olyan módszert, amivel egy domain-specifikus embedding modellt egyetlen GPU-n és egy nap alatt tudnak finomhangolni. A bemutatott recept a Llama-Nemotron-Embed-1B-v2 alapmodellre épül, amely 1 milliárd paraméterrel rendelkezik, és a nyílt forráskódú NeMo keretrendszerben fut.

A technika lényege, hogy a dokumentumokból automatikusan generálja a kérdés- válasz párokat, így nem kell manuálisan címkézni a tréningadatokat. Az NVIDIA által létrehozott szintetikus adathalmazt a nemotron-3-nano-30b-a3b LLM dolgozza fel, amely a szövegből többféle, komplex kérdést és a hozzá tartozó válaszokat állít elő. Ezeket a párokat a NeMo Data Designer ellenőrzi minőségi pontszámokkal, és csak a legmagasabb pontszámúkat használja a finomhangoláshoz.

A finomhangolás során a hard negative mining technikát alkalmazzák, amely segít a modellnek megtanulni, hogy a hasonló, de nem releváns szövegek közül melyeket kell elutasítani. A folyamat egyetlen NVIDIA A100 vagy H100 GPU-n (80 GB memóriával) fut, és a teljes tréning időtartama kevesebb, mint 24 óra.

A kipróbált eredmények alapján a finomhangolt modell 10 % -kal jobb Recall@10 és NDCG@10 pontszámokat ért el, míg a Atlassian JIRA adathalmazon a Recall@60 0,751-ről 0,951-re emelkedett, ami 26 %-os javulás.

Az NVIDIA a folyamatot nyílt forráskódúvá tette, a szintetikus adathalmazt és a kódrészeket a Hugging Face és GitHub platformokon is elérhetővé tette. A következő hetekben a cég a modell ONNX/TensorRT konvertálását és a NIM (NVIDIA Inference Model) platformon való üzembe helyezését fogja további tesztekkel bővíteni. A részletek a Hugging Face blogján olvashatók, ahol a teljes folyamat dokumentációja és a kódszolgáltatások elérhetők.

Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom