ÉlőUtoljára: 3 órájaMa: 26
Kutatásfrissítve: 12:30

Akár 19 F1 ponttal javíthatja a gyógyszeregyeztetést a FHIR adatok formátuma

A klinikai átadásoknál kulcsfontosságú, mégis hibalehetőségekkel teli gyógyszeregyeztetésben a LLM-ek segíthetnek, de az adatok formátuma eddig alulvizsgált terület volt.

Akár 19 F1 ponttal javíthatja a gyógyszeregyeztetést a FHIR adatok formátuma
Fotó: Fotó: Etactics Inc / Unsplash
forrás: ArXiv NLP·AI Forradalom szerk.·
Megosztás

A nagyméretű nyelvi modellek (LLM-ek) teljesítményét jelentősen befolyásolja a bemeneti adatok szerializálási stratégiája, különösen az egészségügyi gyógyszeregyeztetési feladatoknál — derül ki egy új, előnyomtatott formában megjelent kutatásból, amelyet az arXiv-on publikáltak.

A tanulmány négy különböző FHIR adatszerializálási stratégiát (Raw JSON, Markdown Table, Clinical Narrative, Chronological Timeline) vizsgált öt nyílt forráskódú LLM-en (Phi-3.5-mini, Mistral-7B, BioMistral-7B, Llama-3.1-8B, Llama-3.3-70B). A kutatók 200 szintetikus páciens adatait használták fel, összesen 4000 következtetési futtatást végezve.

A szerializálás hatása a modellméretre

Az eredmények szerint a szerializálási stratégia nagymértékben, statisztikailag szignifikánsan befolyásolja a 8 milliárd paraméterig terjedő modellek teljesítményét. A Mistral-7B esetében a 'Clinical Narrative' formátum akár 19 F1 ponttal is felülmúlta a 'Raw JSON' stratégiát — írja az arXiv-on megjelent tanulmány.

A modellméret és a szerializálás kapcsolata

Érdekes fordulatot mutat a 70 milliárd paraméteres modellek vizsgálata: itt a 'Raw JSON' bizonyult hatékonyabbnak, mint a 'Clinical Narrative' — állítja a kutatás. Ez a tendencia arra utal, hogy a nagyobb modellek jobban képesek feldolgozni a strukturálatlanabb, nyers adatformátumokat, míg a kisebb modellek számára a jól strukturált, narratív formátum segíti a kontextus megértését.

A kutatás gyakorlati, bizonyítékokon alapuló formátumajánlásokat kínál a klinikai LLM-ek telepítéséhez: 'Clinical Narrative' a 8B paraméterig terjedő modellekhez, 'Raw JSON' pedig a 70B és annál nagyobb modellekhez. A BioMistral-7B, egy domain-előtanított modell, minden körülmény között nulla használható kimenetet produkált, ami azt mutatja, hogy az előtanítás önmagában nem elegendő a strukturált információk kinyeréséhez. A Llama-3.3-70B modell 2024. március 10-én lett publikálva.

tetszett a cikk? oszd meg →
Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom