Hatékonyabb érvelést ígér a LLM-eknek az új Unary Relational Integracode
A jelenlegi nagyméretű nyelvi modellek (LLM) folyékony szöveget produkálnak, de a tartalom megbízhatóságát nehéz ellenőrizni, ezen segíthet az új eljárás.

Új, elvileg megalapozott módszert dolgoztak ki kutatók, amely hatékonyabbá teheti a nagyméretű nyelvi modellek (LLM) érvelési képességeit, miközben számítási szempontból is praktikus marad — olvasható az arXiv-on előnyomtatott formában megjelent tanulmányban.
A kutatók szerint az új módszer elég hatékony ahhoz, hogy a gyakorlatban is alkalmazható legyen, ráadásul a jelenleg használt szoftver- és hardveralap nagy része is megtartható.
Az új módszer alapja
Az új eljárás két szakaszból áll. Először az adatokat előfeldolgozzák, és egy úgynevezett Unary Relational Integracode formátumba kódolják át. Ez a kód explicit módon írja le a szövegben szereplő objektumok közötti kapcsolatokat, így a modell jobban megérti a kontextust.
A gépi tanulás szerepe
A második szakaszban egy szabványos, de esetleg egyszerűsített gépi tanulási folyamat következik. Ez a megközelítés javíthatja a LLM-ek érvelési képességeit anélkül, hogy jelentős hardver- vagy szoftvercserére lenne szükség, ami komoly előnyt jelenthet a fejlesztők számára.
A tanulmány (arXiv:2605.14036v1) szerint a módszer heuristikus támogatást nyújt a megalapozott érveléshez a besoroló minden egyes hívásán belül, és a hívások között is, ami elengedhetetlen a következő token előrejelzéséhez és az általánosabb érvelési feladatokhoz, például a 2024. május 15-én megjelent kutatásokban.