Az OpenAI GPT-Rosalindja 50 biológiai munkafolyamatra hangolva segíti a kutatókat
A modell a hatalmas adathalmazok kezelésével és a szakterületek közötti nyelvi korlátok áthidalásával segíti a biológiai kutatókat.

Biológiára hangolt nagyméretű nyelvi modellt (LLM) fejlesztett ki az OpenAI, amely a GPT-Rosalind nevet kapta Rosalind Franklin tiszteletére. A rendszer 50 gyakori biológiai munkafolyamatra és a főbb nyilvános biológiai adatbázisok elérésére lett betanítva — írja az Ars Technica.
A modell célja, hogy leküzdje a biológiai kutatás két fő akadályát: a több évtizedes genom-szekvenálás és fehérjekémia által generált hatalmas adathalmazokat, valamint a szakterületek közötti nyelvi korlátokat. Yunyun Wang, az OpenAI élettudományi termékvezetője szerint a GPT-Rosalind képes javaslatot tenni valószínű biológiai útvonalakra és priorizálni a potenciális gyógyszercélpontokat.
A biológiai felfedezés új távlatokkal
Az OpenAI állítása szerint a modellt szkeptikusabbá hangolták, hogy mérsékeljék a LLM-ekre jellemző túlzott lelkesedést és a szándékos bókolást. Így nagyobb valószínűséggel jelzi, ha egy gyógyszercélpont nem megfelelő. A gyártó sokat beszélt a GPT-Rosalind „érvelési” és „szakértői szintű” képességeiről, amelyek összetett, több lépésből álló folyamatokon való munkavégzésből, illetve teljesítményteszt-eredményekből erednek.
A fejlesztés jövője a biológiában
Egyelőre nem világos, hogy az OpenAI mennyire oldotta meg a hallucinációk problémáját, amely számos LLM-et sújt. A modell jelenleg korlátozottan hozzáférhető, csak az Egyesült Államokban bejegyzett entitások jelentkezhetnek az OpenAI megbízható hozzáférési programjára. A korlátozás oka a potenciálisan káros kimenetekkel kapcsolatos aggodalmak, például egy vírus fertőzőképességének optimalizálása.
A Life Sciences Research Plugin 2024-ben elérhető lesz az Egyesült Államokban, a GPT-Rosalind modellhez hasonlóan, az OpenAI megbízható hozzáférési programján keresztül.