Frissítve: 2 órája·Ma: 4
Kutatás
AI által generált szöveg

Adatvédelmi onkológiai döntéstámogató rendszer 56-szoros gyorsulással az AMD MI300X-en

Az új rendszer két finomhangolt LLM-et használ, LangGraph topológiával és négyfokozatú Corrective RAG folyamat-nal, amely több mint 70 orvosi irányelvre támaszkodik.

Adatvédelmi onkológiai döntéstámogató rendszer 56-szoros gyorsulással az AMD MI300X-en
Fotó: Logan Gutierrez / Unsplash
Forrás: Hugging FaceSzerző: AI Forradalom szerk.
Megosztás

Az OncoAgent Research Group egy nyílt forráskódú, adatvédelmi szempontból biztonságos klinikai döntéstámogató rendszert fejlesztett ki onkológiai célokra, amely AMD Instinct MI300X hardveren rendkívül gyorsan finomhangolható — derül ki a lablab-ai-amd-developer-hackathonon bemutatott előzetes tanulmányból.

A rendszer kettős szintű, finomhangolt LLM architektúrát alkalmaz, multi-ügynök alapú LangGraph topológiával. Emellett egy négyfokozatú Corrective RAG (CRAG) folyamat-t is beépítettek, amely több mint 70 orvosok által használt NCCN és ESMO irányelvre támaszkodik. A rendszer egy háromrétegű reflexiós biztonsági validátorral is rendelkezik, amely szigorú Zero-PHI (Protected Health Information) politikát érvényesít.

Gyors finomhangolás AMD hardveren

A klinikai lekérdezéseket a rendszer egy összetettségi pontszám alapján irányítja egy 9 milliárd paraméteres, sebességre optimalizált modellhez (Tier 1) vagy egy 27 milliárd paraméteres, mélyebb érvelésű modellhez (Tier 2). Mindkét modellt QLoRA módszerrel finomhangolták az Unsloth keretrendszer segítségével, 266 854 valós és szintetikusan generált onkológiai eseten, AMD Instinct MI300X hardveren. A finomhangolás a MI300X-en mindössze 50 percet vett igénybe a teljes adatkészleten, ami 56-szoros átviteli gyorsulást jelent az API-alapú generációhoz képest — állítja az OncoAgent Research Group.

Az OncoAgent teljes rendszere 100%-ban nyílt forráskódú és helyben telepíthető, ezzel kiküszöböli a felhőalapú API-függőséget és biztosítja a betegadatok szuverenitását. A klinikai érvelést nyolc specializált LangGraph csomópontra bontották. Minden modell kimenetét egy kurált vektoros tudásbázishoz rögzítik egy négyfokozatú lekérési folyamat-on keresztül, explicit relevancia-szűréssel.

A Corrective RAG dokumentumértékelése 100%-os sikerarányt ért el, átlagosan 2,3+ RAG megbízhatósági pontszámmal — közölte az OncoAgent Research Group. A teljes következtetési és betanítási verem natívan fut az AMD Instinct MI300X-en, ROCm és nyílt forráskódú keretrendszerek használatával.

Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom