Csecsemők tanulását utánozza az új AI-modell — tárgyakat és mozgást is ért
A jelenlegi mélytanulási modellekkel ellentétben, amelyek hatalmas adathalmazok statisztikai korrelációiból dolgoznak, az új megközelítés korlátozott tapasztalatból is képes a világ alapvető szerkezetét elsajátítani.

Új felügyelet nélküli tanulási módszert javasolnak kutatók, amely a csecsemők kognitív fejlődését modellezi, és képes a tárgyak szegmentálására, valamint a mozgástörvények kivonására dinamikus képsorozatokból — derül ki az arXiv előnyomtatott tanulmányából.
A jelenlegi mélytanulási modellek, bár nagy teljesítményt érnek el statisztikai korrelációk tanulásával, nem rendelkeznek az emberi – különösen a preverbális csecsemők – rugalmasságával. Nem képesek autonóm módon elsajátítani a világ alapvető szerkezetét korlátozott tapasztalatból, és alkalmazkodni új helyzetekhez, állítják a kutatók.
A javasolt modell egy integrált architektúrát használ, amely egyszerre végez objektumszegmentációt és mozgástörvény-kivonást. Ez a megközelítés a csoportműveletek hierarchikus kapcsolatán alapul, nem pedig statisztikai függetlenségen, ezzel a csecsemők tanulási mechanizmusait utánozza.
A modell az algebrai homomorfizmust vezeti be strukturális korlátként a neurális hálózatba. Ez lehetővé teszi, hogy a pixel szintű változásokat értelmes, lebontott transzformációkra válassza szét, ami a kutatók szerint kulcsfontosságú a rugalmasabb és emberibb tanulás eléréséhez.
A kutatás célja egy olyan számítógépes modell építése, amely jobban megérti és reprodukálja a csecsemők kognitív fejlődését, különös tekintettel arra, hogyan sajátítják el a világ szerkezetét minimális adatokból. A tanulmány az arXiv:2604.20925v1 számon érhető el.