ÉlőUtoljára: 1 órájaMa: 18
Kutatásfrissítve: 05:30

LLM-ek célfelismerő képességeit vizsgálja új kutatás — eltérő eredményekkel

A klasszikus tervezőalgoritmusokhoz képest a LLM-ek eddig inkább a világismeretükre támaszkodtak, mintsem a szimbolikus érvelésre, de a célfelismerés más megközelítést igényel.

LLM-ek célfelismerő képességeit vizsgálja új kutatás — eltérő eredményekkel
Fotó: Fotó: National Cancer Institute / Unsplash
forrás: ArXiv AI·AI Forradalom szerk.·
Megosztás

Rendszeresen értékelik a nagy nyelvi modelleket (LLM) a nulla-shot célfelismerés terén, a kulcsfontosságú klasszikus PDDL-teljesítménytesztek alapján — írja az ArXiv-en megjelent tanulmány. A célfelismerés egy abduktív feladat, amely jobban illeszkedik a LLM-ek erősségeihez, mivel a világismerettel való konzisztenciát értékeli, nem pedig új cselekvéssorozatok generálását.

A kutatás szerint a LLM-ek célfelismerő képességei egyenetlenek. Egyes modellek a rendelkezésre álló bizonyítékok mennyiségével együtt skálázódnak, és teljes megfigyelés esetén megközelítik a landmark-alapú pontosságot. Más modellek azonban továbbra is az előzetes világismereti alapjaikhoz ragaszkodnak, függetlenül attól, mennyi bizonyíték gyűlik össze.

A modell érvelési nyomvonalainak kvalitatív elemzése feltárta, hogy ez az eltérés a bizonyíték-integráció alapvető különbségeit tükrözi. A nulla-shot prompting során a modell csak egy feladatutasítást kap, demonstrációk vagy címkézett példák nélkül, és teljes mértékben az előzetesen betanított tudására kell támaszkodnia a megfelelő válasz generálásához.

A DreamZero projekt például mindössze 30 percnyi játékadat (55 trajektória) alapján képes alkalmazkodni a YAM robothoz, és nulla-shot módon általánosítani új tárgyakra, mint például sütőtök, plüssmackó vagy papírzacskó. Az AgiBot előzetes betanításából szerzett tudás közvetlenül átvihető, további finomhangolás nélkül.

tetszett a cikk? oszd meg →
Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom