Nehezebb feladatoknál másképp gondolkodnak a mesterséges intelligencia modellek

A mesterséges intelligencia modellek nem csak tovább gondolkodnak, hanem másképp is, amikor nehéz problémákkal szembesülnek — állítja egy új kutatás, amely előnyomtatott formában jelent meg az arXiv preprint szerveren.

A tanulmány a nyelvi modellek belső működését vizsgálta, különösen azt, hogyan változik a gondolkodási folyamatuk nehéz feladatok esetén. Eddig úgy tűnt, a modellek egyszerűen több lépést számolnak ki, ha bonyolultabb kérdést kapnak, de ez a kutatás mélyebbre ásott a jelenség megértésében.

A gondolkodás mélyebb rétegei

A kutatók a lánc-gondolkodás (chain-of-thought) során keletkező rejtett állapotok trajektóriáit elemezték. Ez a módszer segít megkülönböztetni, hogy a modell csupán hosszabb számítást végez, vagy minőségileg eltérő belső útvonalat követ. A nyers trajektória-geometria erősen függ a generálás hosszától, ezért a nehézségtől függő összehasonlítások félrevezetőek lennének korrekció nélkül.

A generálás hosszához igazított trajektória-statisztikák után a nehézség továbbra is szisztematikusan kapcsolódott a korrigált trajektória-geometriához a vizsgált területeken. Ez magában foglalta a versenyprogramozást, a matematikát és a Boole-féle kielégíthetőségi problémákat is.

A gondolkodás új ösvényei

A legtisztább, érvelés-specifikus elkülönülés a kódolási feladatoknál mutatkozott. Itt a nehezebb problémák esetén a modellek közvetlenebb korrigált trajektóriákat és kevésbé heterogén lokális görbületet mutattak. A kutatás 2024. január 10-én jelent meg az arXiv preprint szerveren, az arXiv:2301.00001 azonosítóval.