ÉlőUtoljára: 2 perceMa: 8
Kutatásfrissítve: 04:45

A RASPRef keretrendszer fejleszti a promptokat emberi felügyelet nélkül

Rahul Soni szerint a RASPRef keretrendszerrel elérhető javulás a GSM8K-stílusú matematikai okoskodási feladatokban

A RASPRef keretrendszer fejleszti a promptokat emberi felügyelet nélkül
Fotó: Fotó: Nicolás Beltrán López / Unsplash
forrás: ArXiv NLP·AI Forradalom szerk.·
Megosztás

Rahul Soni a RASPRef nevű keretrendszerrel bemutatta, hogy a promptok automatikusan javíthatók nagyobb okos modellekhez, például a DeepSeek R1 és az OpenAI o1 esetében, anélkül, hogy emberi felügyeletre lenne szükség. A kutatás a GSM8K‑stílusú matematikai feladatokon futtatta le a módszert, és a statikus promptokhoz képest mérhető javulást ért el.

A RASPRef a promptot nem csupán a modell bemeneteként kezeli, hanem egy optimalizálható célként. A rendszer először releváns példákat és korábban generált gondolkodási útvonalakat keres ki, majd többféle önellenőrző jelet – több mint egy mintától származó konzisztencia, ellenőrző visszajelzés és a modell által létrehozott kritikák – használva finomhangolja a promptot. Így a prompt önmagában is „tanul”, a feladat specifikus felügyelet nélkül.

A módszer lényege a retrieval‑augmented self‑supervised refinement: a promptot egy iteratív, keresés‑alapú folyamat során fejlesztik, miközben a modell saját előrejelzéseiből és kritikáiból nyer ki visszajelzést. Ez a megközelítés különbözik a korábbi, csak a modell kimenetére fókuszáló technikáktól, mert a promptot közvetlenül célozza meg.

A kísérletek során a GSM8K‑ben a RASPRef javított a teljesítményt a statikus prompt alapjához képest, de a részletes százalékos növekedést a cikk nem ismertette. A kutatók rámutattak, hogy a retrieval minősége, a kiválasztott útvonalak és a self‑supervised visszajelzések minősége jelentősen befolyásolja a finomhangolás hatékonyságát.

Jelenleg a RASPRef egy kutatási prototípus, de a fejlesztők szerint a keretrendszer praktikus és skálázható stratégia lehet a jövőbeli, nagyobb okos modellek promptjainak fejlesztésére. A következő lépések közé tartozik a módszer más, komplexebb feladatokra, például többlépcsős kérdés-válaszra és logikai döntéshozatalra történő alkalmazása. A kutatók a következő hónapokban tervezik a részletes eredmények publikálását, amelyben a RASPRef teljes potenciálját és a lehetséges korlátait is bemutatják.

tetszett a cikk? oszd meg →
Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom