Az Apple Velox rendszere 4D-s objektumok geometriáját és megjelenését is rögzíti
A Velox egy kódolót használ a téridőbeli színes pontfelhők dinamikus alakzat tokenekké történő tömörítésére, minimális bemeneti adattal dolgozva.

Új keretrendszert mutatott be az Apple ML a 4D-s objektumok látens reprezentációinak megtanulására, amely hűen rögzíti az objektumok geometriáját és megjelenését — írja az Apple ML kutatócsoportja.
A Velox modelljei egyaránt képesek megtanulni a statikus és dinamikus 4D-s objektumok reprezentációját, ami széles körben alkalmazható a számítógépes látás területén.
A Mélytanulás Mélyvízében
A rendszer két kiegészítő dekóderrel felügyeli a tokeneket: egy 4D-s felület dekóderrel, amely a geometria időben változó felületi eloszlását modellezi, és egy Gauss-dekóderrel, amely a tokeneket 3D-s Gauss-eloszlásokra képezi le, segítve a megjelenés megtanulását.
A 4D-s Valóság Kapujában
A Velox reprezentációjának hasznosságát három különböző feladatban is tesztelték: videó-4D generálásban, 3D-s követésben és ruha szimulációban, kép-4D generálás segítségével.
Az Apple ML kutatócsoportja 2026 májusában publikálta a Velox rendszerrel kapcsolatos eredményeit a CVPR konferencián, ahol a modell erős teljesítményt mutatott a tesztfeladatokban.