Kutatás2026. máj. 23.frissítve: 15:30

DivSkill-SQL +11,1 ponttal növeli a Snowflake SQL pontosságot

A kutatók egy új residual skill optimalizációs keretrendszert mutattak be, amely modell finomhangolás nélkül épít kiegészítő ügynököket.

Fotó: Tommy Pascale / Unsplash

forrás: ArXiv NLP·AI Forradalom szerk.·2026. május 23.

Megosztás

A Stanford és MIT kutatói által írt preprint szerint a Text-to-SQL feladatokban a hagyományos ensemble‑ek hatékonysága a Pass@K metrikában korlátozott — írja az arXiv.

Miért nem elég a véletlenszerű dekódolás?

A jelenlegi megközelítések a változatos dekódolást vagy prompt‑variációkat használják, de a generált SQL jelöltek gyakran hasonló hibákat tartalmaznak, így a sikeres találatok aránya alacsony marad.

Residual skill optimalizáció a gyakorlatban

Az új DivSkill‑SQL keretrendszer minden új képességet a meglévő ensemble által hibázott példákon finomít, ezáltal közvetlenül a Pass@K margóális javulását célozza meg. A módszer nem igényel semmiféle modell finomhangolást, így könnyen beilleszthető bármely LLM‑be.

A Spider2‑Lite teljesítményteszten a szerzők szerint a DivSkill‑SQL +11,1 ponttal növeli a kiválasztott pontosságot a Snowflake adatbázison, és +8,3 pontot a BigQuery‑n, szemben a legerősebb baseline‑szal. A javulás mindkét alapmodell, az Opus‑4.6 és a GPT‑5.4 esetén konzisztens.

A kutatók továbbá azt állítják, hogy egyetlen SQL dialektusra optimalizált képességek újraképzés nélkül átvihetők más dialektusokra, például a Snowflake‑ről a BigQuery‑re, bár ezt a széles körű adatbázis‑környezetben még nem tesztelték.

A Spider2‑Lite tesztek 2026. májusában mutatták, hogy a DivSkill‑SQL +11,1 ponttal javítja a Snowflake pontosságot.

tetszett a cikk? oszd meg →

Megosztás