DivSkill-SQL +11,1 ponttal növeli a Snowflake SQL pontosságot
A kutatók egy új residual skill optimalizációs keretrendszert mutattak be, amely modell finomhangolás nélkül épít kiegészítő ügynököket.

A Stanford és MIT kutatói által írt preprint szerint a Text-to-SQL feladatokban a hagyományos ensemble‑ek hatékonysága a Pass@K metrikában korlátozott — írja az arXiv.
Miért nem elég a véletlenszerű dekódolás?
A jelenlegi megközelítések a változatos dekódolást vagy prompt‑variációkat használják, de a generált SQL jelöltek gyakran hasonló hibákat tartalmaznak, így a sikeres találatok aránya alacsony marad.
Residual skill optimalizáció a gyakorlatban
Az új DivSkill‑SQL keretrendszer minden új képességet a meglévő ensemble által hibázott példákon finomít, ezáltal közvetlenül a Pass@K margóális javulását célozza meg. A módszer nem igényel semmiféle modell finomhangolást, így könnyen beilleszthető bármely LLM‑be.
A Spider2‑Lite teljesítményteszten a szerzők szerint a DivSkill‑SQL +11,1 ponttal növeli a kiválasztott pontosságot a Snowflake adatbázison, és +8,3 pontot a BigQuery‑n, szemben a legerősebb baseline‑szal. A javulás mindkét alapmodell, az Opus‑4.6 és a GPT‑5.4 esetén konzisztens.
A kutatók továbbá azt állítják, hogy egyetlen SQL dialektusra optimalizált képességek újraképzés nélkül átvihetők más dialektusokra, például a Snowflake‑ről a BigQuery‑re, bár ezt a széles körű adatbázis‑környezetben még nem tesztelték.
A Spider2‑Lite tesztek 2026. májusában mutatták, hogy a DivSkill‑SQL +11,1 ponttal javítja a Snowflake pontosságot.