Frissítve: 11 perce·Ma: 59
Kutatás
AI által generált szöveg

A RASPRef keretrendszer fejleszti a promptokat emberi felügyelet nélkül

Rahul Soni szerint a RASPRef keretrendszerrel elérhető javulás a GSM8K-stílusú matematikai okoskodási feladatokban

A RASPRef keretrendszer fejleszti a promptokat emberi felügyelet nélkül
Fotó: Nicolás Beltrán López / Unsplash
Forrás: ArXiv NLPSzerző: AI Forradalom szerk.
Megosztás

Rahul Soni a RASPRef nevű keretrendszerrel bemutatta, hogy a promptok automatikusan javíthatók nagyobb okos modellekhez, például a DeepSeek R1 és az OpenAI o1 esetében, anélkül, hogy emberi felügyeletre lenne szükség. A kutatás a GSM8K‑stílusú matematikai feladatokon futtatta le a módszert, és a statikus promptokhoz képest mérhető javulást ért el.

A RASPRef a promptot nem csupán a modell bemeneteként kezeli, hanem egy optimalizálható célként. A rendszer először releváns példákat és korábban generált gondolkodási útvonalakat keres ki, majd többféle önellenőrző jelet – több mint egy mintától származó konzisztencia, ellenőrző visszajelzés és a modell által létrehozott kritikák – használva finomhangolja a promptot. Így a prompt önmagában is „tanul”, a feladat specifikus felügyelet nélkül.

A módszer lényege a retrieval‑augmented self‑supervised refinement: a promptot egy iteratív, keresés‑alapú folyamat során fejlesztik, miközben a modell saját előrejelzéseiből és kritikáiból nyer ki visszajelzést. Ez a megközelítés különbözik a korábbi, csak a modell kimenetére fókuszáló technikáktól, mert a promptot közvetlenül célozza meg.

A kísérletek során a GSM8K‑ben a RASPRef javított a teljesítményt a statikus prompt alapjához képest, de a részletes százalékos növekedést a cikk nem ismertette. A kutatók rámutattak, hogy a retrieval minősége, a kiválasztott útvonalak és a self‑supervised visszajelzések minősége jelentősen befolyásolja a finomhangolás hatékonyságát.

Jelenleg a RASPRef egy kutatási prototípus, de a fejlesztők szerint a keretrendszer praktikus és skálázható stratégia lehet a jövőbeli, nagyobb okos modellek promptjainak fejlesztésére. A következő lépések közé tartozik a módszer más, komplexebb feladatokra, például többlépcsős kérdés-válaszra és logikai döntéshozatalra történő alkalmazása. A kutatók a következő hónapokban tervezik a részletes eredmények publikálását, amelyben a RASPRef teljes potenciálját és a lehetséges korlátait is bemutatják.

Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom