Kutatás2026. máj. 29.frissítve: 23:30

Ötször gyorsabbak az LLM-ek a biológiai adatok annotálásában, mint a korábbi eszközök

Az Anthropic és az OpenAI modelljei ötször gyorsabban dolgozzák fel a biológiai leírásokat, mint a korábbi NLP-eszközök, és emberi szinten teljesítenek az annotálásban.

Fotó: Indra Projects / Unsplash

forrás: ArXiv AI·AI Forradalom szerk.·2026. május 29.

Megosztás

Az új LLM-alapú ügynökök jelentősen felgyorsítják a biológiai adatok rendszerezését, leküzdve a korábbi munkaerőigényes folyamatokat. A kutatók öt vezető LLM-et teszteltek, amelyek „ügynöki kurátorként” működtek egy önálló munkaterületen. Ez a megközelítés a korábbi, emberi szakértőkre támaszkodó módszerekkel szemben kulcsfontosságú előrelépést jelent — közölte a Stanford és a Google Robotics közös tanulmánya.

A korábbi, 2018-as teljesítménytesztet újraértékelve, ahol a gépi és emberi konzisztencia alacsonyabb volt az emberi kurátorok közötti konzisztenciánál, az új ügynökök minden vizsgált metrikában jelentősen felülmúlták a korábbi Semantic CharaParser NLP-eszközt. Az ügynökök teljesítménye beleesett a korábbi emberi kurátorok variabilitásának tartományába, megközelítve, de nem elérve a legjobb emberi teljesítményt.

Kapcsolódó: orvosi LLM-ek fejlesztése

A biológiai adatok új horizontja

Az ügynökök egy PDF-forráskiadványt, egy annotációs útmutatót, valamint négy projektontológiát (UBERON, PATO, BSPO, GO) kaptak, és egy validációs szkript segítségével értékelték őket. Ez a robusztus környezet lehetővé tette a modellek számára, hogy hatékonyan végezzék el a szabad szöveges fenotípus-leírások ontológiai kifejezésekhez való hozzárendelését, ami az összehasonlítható morfológiai adatok tanulmányok közötti integrálásához elengedhetetlen.

Kapcsolódó: növénykutatás gyorsítása

A gépi annotáció új korszaka

A kutatás rávilágít arra, hogy a frontier LLM-ek képesek áthidalni az ontológia-kuráció szűk keresztmetszetét a természetes fenotípusok esetében. Az ügynökök ötször gyorsabban végezték el az annotációt, mint a korábbi eszközök, és az emberi kurátorok teljesítménytartományán belül maradtak, ami jelentős előrelépés a gépi annotáció pontossága és sebessége terén. A Stanford és a Google Robotics közös tanulmánya 2024-ben várható folytatása az Anthropic és az OpenAI modelljeinek további fejlesztését fogja tartalmazni.

Kapcsolódó: tudományos adatelemzés

tetszett a cikk? oszd meg →

Megosztás