Nehezebb feladatoknál másképp gondolkodnak a mesterséges intelligencia modellek
A lánc-gondolkodás (chain-of-thought) során a modellek rejtett állapotainak elemzése alapján a nehezebb problémákra adott válaszok belső 'útvonala' is eltérő.

A mesterséges intelligencia modellek nem csak tovább gondolkodnak, hanem másképp is, amikor nehéz problémákkal szembesülnek — állítja egy új kutatás, amely előnyomtatott formában jelent meg az arXiv preprint szerveren.
A tanulmány a nyelvi modellek belső működését vizsgálta, különösen azt, hogyan változik a gondolkodási folyamatuk nehéz feladatok esetén. Eddig úgy tűnt, a modellek egyszerűen több lépést számolnak ki, ha bonyolultabb kérdést kapnak, de ez a kutatás mélyebbre ásott a jelenség megértésében.
A gondolkodás mélyebb rétegei
A kutatók a lánc-gondolkodás (chain-of-thought) során keletkező rejtett állapotok trajektóriáit elemezték. Ez a módszer segít megkülönböztetni, hogy a modell csupán hosszabb számítást végez, vagy minőségileg eltérő belső útvonalat követ. A nyers trajektória-geometria erősen függ a generálás hosszától, ezért a nehézségtől függő összehasonlítások félrevezetőek lennének korrekció nélkül.
A generálás hosszához igazított trajektória-statisztikák után a nehézség továbbra is szisztematikusan kapcsolódott a korrigált trajektória-geometriához a vizsgált területeken. Ez magában foglalta a versenyprogramozást, a matematikát és a Boole-féle kielégíthetőségi problémákat is.
A gondolkodás új ösvényei
A legtisztább, érvelés-specifikus elkülönülés a kódolási feladatoknál mutatkozott. Itt a nehezebb problémák esetén a modellek közvetlenebb korrigált trajektóriákat és kevésbé heterogén lokális görbületet mutattak. A kutatás 2024. január 10-én jelent meg az arXiv preprint szerveren, az arXiv:2301.00001 azonosítóval.