Frissítve: 2 órája·Ma: 15
Kutatás
AI által generált szöveg

BioTool adathalmazzal javul az orvosi LLM-ek eszközhasználata — 7040 lekérdezés-párral

A BioTool 7040 emberi ellenőrzésű lekérdezés-API hívás párt tartalmaz, amely a variáció, genomika, proteomika, evolúció és általános biológia területeit fedi le.

BioTool adathalmazzal javul az orvosi LLM-ek eszközhasználata — 7040 lekérdezés-párral
Fotó: Lucas Vasques / Unsplash
Forrás: ArXiv NLPSzerző: AI Forradalom szerk.
Megosztás

Új, átfogó adathalmazt mutattak be BioTool néven, amely a nagyméretű nyelvi modellek (LLM) biomedicinális képességeinek finomhangolására készült — írja az ArXiv NLP-n megjelent tanulmány.

A kutatók szerint a LLM-ek általános feladatokban elért sikere ellenére a biomedicina rendkívül specializált területén a teljesítményük még mindig nem kielégítő. Ennek fő oka az, hogy a LLM-ek nem képesek hatékonyan használni azokat a biomedicinális eszközöket, amelyekre a klinikai szakértők és kutatók naponta támaszkodnak.

A BioTool 34 gyakran használt eszközt gyűjtött össze a NCBI, Ensembl és UniProt adatbázisokból. Az adathalmaz 7040 magas minőségű, emberi ellenőrzésű lekérdezés-API hívás párt tartalmaz, amelyek a genomika, proteomika és evolúció területeit ölelik fel.

A korábbi, általános célú eszközhívó adathalmazok jelentősen javították a LLM-ügynökök képességeit, ám a biomedicinális területen eddigi erőfeszítések nagyrészt a kontextusban történő tanulásra támaszkodtak, és a modelleket csak kevés eszközre korlátozták. A BioTool ezt a hiányosságot igyekszik pótolni, és a finomhangolással jelentős előrelépést hozhat a biomedicinális LLM-ek fejlesztésében.

Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom