Frissítve: 2 órája·Ma: 15
Kutatás
AI által generált szöveg

Nehezebb feladatoknál másképp gondolkodnak a mesterséges intelligencia modellek

A lánc-gondolkodás (chain-of-thought) során a modellek rejtett állapotainak elemzése alapján a nehezebb problémákra adott válaszok belső 'útvonala' is eltérő.

Nehezebb feladatoknál másképp gondolkodnak a mesterséges intelligencia modellek
Fotó: Ecliptic Graphic / Unsplash
Forrás: ArXiv NLPSzerző: AI Forradalom szerk.
Megosztás

A mesterséges intelligencia modellek nem csak tovább gondolkodnak, hanem másképp is, amikor nehéz problémákkal szembesülnek — állítja egy új kutatás, amely előnyomtatott formában jelent meg az arXiv preprint szerveren.

A tanulmány a nyelvi modellek belső működését vizsgálta, különösen azt, hogyan változik a gondolkodási folyamatuk nehéz feladatok esetén. Eddig úgy tűnt, a modellek egyszerűen több lépést számolnak ki, ha bonyolultabb kérdést kapnak, de ez a kutatás mélyebbre ásott a jelenség megértésében.

A gondolkodás mélyebb rétegei

A kutatók a lánc-gondolkodás (chain-of-thought) során keletkező rejtett állapotok trajektóriáit elemezték. Ez a módszer segít megkülönböztetni, hogy a modell csupán hosszabb számítást végez, vagy minőségileg eltérő belső útvonalat követ. A nyers trajektória-geometria erősen függ a generálás hosszától, ezért a nehézségtől függő összehasonlítások félrevezetőek lennének korrekció nélkül.

A generálás hosszához igazított trajektória-statisztikák után a nehézség továbbra is szisztematikusan kapcsolódott a korrigált trajektória-geometriához a vizsgált területeken. Ez magában foglalta a versenyprogramozást, a matematikát és a Boole-féle kielégíthetőségi problémákat is.

A gondolkodás új ösvényei

A legtisztább, érvelés-specifikus elkülönülés a kódolási feladatoknál mutatkozott. Itt a nehezebb problémák esetén a modellek közvetlenebb korrigált trajektóriákat és kevésbé heterogén lokális görbületet mutattak. A kutatás 2024. január 10-én jelent meg az arXiv preprint szerveren, az arXiv:2301.00001 azonosítóval.

Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom