Kutatás2026. máj. 8.frissítve: 22:50

Az Apple Velox rendszere 4D-s objektumok geometriáját és megjelenését is rögzíti

A Velox egy kódolót használ a téridőbeli színes pontfelhők dinamikus alakzat tokenekké történő tömörítésére, minimális bemeneti adattal dolgozva.

Fotó: BoliviaInteligente / Unsplash

forrás: Apple ML·AI Forradalom szerk.·2026. május 8.

Megosztás

Új keretrendszert mutatott be az Apple ML a 4D-s objektumok látens reprezentációinak megtanulására, amely hűen rögzíti az objektumok geometriáját és megjelenését — írja az Apple ML kutatócsoportja.

A Velox modelljei egyaránt képesek megtanulni a statikus és dinamikus 4D-s objektumok reprezentációját, ami széles körben alkalmazható a számítógépes látás területén.

A Mélytanulás Mélyvízében

A rendszer két kiegészítő dekóderrel felügyeli a tokeneket: egy 4D-s felület dekóderrel, amely a geometria időben változó felületi eloszlását modellezi, és egy Gauss-dekóderrel, amely a tokeneket 3D-s Gauss-eloszlásokra képezi le, segítve a megjelenés megtanulását.

A 4D-s Valóság Kapujában

A Velox reprezentációjának hasznosságát három különböző feladatban is tesztelték: videó-4D generálásban, 3D-s követésben és ruha szimulációban, kép-4D generálás segítségével.

Az Apple ML kutatócsoportja 2026 májusában publikálta a Velox rendszerrel kapcsolatos eredményeit a CVPR konferencián, ahol a modell erős teljesítményt mutatott a tesztfeladatokban.

tetszett a cikk? oszd meg →

Megosztás