BioTool adathalmazzal javul az orvosi LLM-ek eszközhasználata — 7040 lekérdezés-párral
A BioTool 7040 emberi ellenőrzésű lekérdezés-API hívás párt tartalmaz, amely a variáció, genomika, proteomika, evolúció és általános biológia területeit fedi le.

Új, átfogó adathalmazt mutattak be BioTool néven, amely a nagyméretű nyelvi modellek (LLM) biomedicinális képességeinek finomhangolására készült — írja az ArXiv NLP-n megjelent tanulmány.
A kutatók szerint a LLM-ek általános feladatokban elért sikere ellenére a biomedicina rendkívül specializált területén a teljesítményük még mindig nem kielégítő. Ennek fő oka az, hogy a LLM-ek nem képesek hatékonyan használni azokat a biomedicinális eszközöket, amelyekre a klinikai szakértők és kutatók naponta támaszkodnak.
A BioTool 34 gyakran használt eszközt gyűjtött össze a NCBI, Ensembl és UniProt adatbázisokból. Az adathalmaz 7040 magas minőségű, emberi ellenőrzésű lekérdezés-API hívás párt tartalmaz, amelyek a genomika, proteomika és evolúció területeit ölelik fel.
A korábbi, általános célú eszközhívó adathalmazok jelentősen javították a LLM-ügynökök képességeit, ám a biomedicinális területen eddigi erőfeszítések nagyrészt a kontextusban történő tanulásra támaszkodtak, és a modelleket csak kevés eszközre korlátozták. A BioTool ezt a hiányosságot igyekszik pótolni, és a finomhangolással jelentős előrelépést hozhat a biomedicinális LLM-ek fejlesztésében.