Adatvédelmi onkológiai döntéstámogató rendszer 56-szoros gyorsulással az AMD MI300X-en

Az OncoAgent Research Group egy nyílt forráskódú, adatvédelmi szempontból biztonságos klinikai döntéstámogató rendszert fejlesztett ki onkológiai célokra, amely AMD Instinct MI300X hardveren rendkívül gyorsan finomhangolható — derül ki a lablab-ai-amd-developer-hackathonon bemutatott előzetes tanulmányból.

A rendszer kettős szintű, finomhangolt LLM architektúrát alkalmaz, multi-ügynök alapú LangGraph topológiával. Emellett egy négyfokozatú Corrective RAG (CRAG) folyamat-t is beépítettek, amely több mint 70 orvosok által használt NCCN és ESMO irányelvre támaszkodik. A rendszer egy háromrétegű reflexiós biztonsági validátorral is rendelkezik, amely szigorú Zero-PHI (Protected Health Information) politikát érvényesít.

Gyors finomhangolás AMD hardveren

A klinikai lekérdezéseket a rendszer egy összetettségi pontszám alapján irányítja egy 9 milliárd paraméteres, sebességre optimalizált modellhez (Tier 1) vagy egy 27 milliárd paraméteres, mélyebb érvelésű modellhez (Tier 2). Mindkét modellt QLoRA módszerrel finomhangolták az Unsloth keretrendszer segítségével, 266 854 valós és szintetikusan generált onkológiai eseten, AMD Instinct MI300X hardveren. A finomhangolás a MI300X-en mindössze 50 percet vett igénybe a teljes adatkészleten, ami 56-szoros átviteli gyorsulást jelent az API-alapú generációhoz képest — állítja az OncoAgent Research Group.

Az OncoAgent teljes rendszere 100%-ban nyílt forráskódú és helyben telepíthető, ezzel kiküszöböli a felhőalapú API-függőséget és biztosítja a betegadatok szuverenitását. A klinikai érvelést nyolc specializált LangGraph csomópontra bontották. Minden modell kimenetét egy kurált vektoros tudásbázishoz rögzítik egy négyfokozatú lekérési folyamat-on keresztül, explicit relevancia-szűréssel.

A Corrective RAG dokumentumértékelése 100%-os sikerarányt ért el, átlagosan 2,3+ RAG megbízhatósági pontszámmal — közölte az OncoAgent Research Group. A teljes következtetési és betanítási verem natívan fut az AMD Instinct MI300X-en, ROCm és nyílt forráskódú keretrendszerek használatával.