ÉlőUtoljára: 31 perceMa: 0
Kutatásfrissítve: 21:30

Ötször gyorsabbak a LLM-ek a biológiai adatok annotálásában, mint a korábbi eszközök

Az Anthropic és az OpenAI modelljei ötször gyorsabban dolgozzák fel a biológiai leírásokat, mint a korábbi NLP-eszközök, és emberi szinten teljesítenek az annotálásban.

Ötször gyorsabbak a LLM-ek a biológiai adatok annotálásában, mint a korábbi eszközök
Fotó: Fotó: Indra Projects / Unsplash
forrás: ArXiv AI·AI Forradalom szerk.·
Megosztás

Az új LLM-alapú ügynökök jelentősen felgyorsítják a biológiai adatok rendszerezését, leküzdve a korábbi munkaerőigényes folyamatokat. A kutatók öt vezető LLM-et teszteltek, amelyek „ügynöki kurátorként” működtek egy önálló munkaterületen. Ez a megközelítés a korábbi, emberi szakértőkre támaszkodó módszerekkel szemben kulcsfontosságú előrelépést jelent — közölte a Stanford és a Google Robotics közös tanulmánya.

A korábbi, 2018-as teljesítménytesztet újraértékelve, ahol a gépi és emberi konzisztencia alacsonyabb volt az emberi kurátorok közötti konzisztenciánál, az új ügynökök minden vizsgált metrikában jelentősen felülmúlták a korábbi Semantic CharaParser NLP-eszközt. Az ügynökök teljesítménye beleesett a korábbi emberi kurátorok variabilitásának tartományába, megközelítve, de nem elérve a legjobb emberi teljesítményt.

Kapcsolódó: orvosi LLM-ek fejlesztése

A biológiai adatok új horizontja

Az ügynökök egy PDF-forráskiadványt, egy annotációs útmutatót, valamint négy projektontológiát (UBERON, PATO, BSPO, GO) kaptak, és egy validációs szkript segítségével értékelték őket. Ez a robusztus környezet lehetővé tette a modellek számára, hogy hatékonyan végezzék el a szabad szöveges fenotípus-leírások ontológiai kifejezésekhez való hozzárendelését, ami az összehasonlítható morfológiai adatok tanulmányok közötti integrálásához elengedhetetlen.

Kapcsolódó: növénykutatás gyorsítása

A gépi annotáció új korszaka

A kutatás rávilágít arra, hogy a frontier LLM-ek képesek áthidalni az ontológia-kuráció szűk keresztmetszetét a természetes fenotípusok esetében. Az ügynökök ötször gyorsabban végezték el az annotációt, mint a korábbi eszközök, és az emberi kurátorok teljesítménytartományán belül maradtak, ami jelentős előrelépés a gépi annotáció pontossága és sebessége terén. A Stanford és a Google Robotics közös tanulmánya 2024-ben várható folytatása az Anthropic és az OpenAI modelljeinek további fejlesztését fogja tartalmazni.

Kapcsolódó: tudományos adatelemzés

tetszett a cikk? oszd meg →
Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom