Frissítve: 2 órája·Ma: 15
Kutatás
AI által generált szöveg

Az Apple Velox rendszere 4D-s objektumok geometriáját és megjelenését is rögzíti

A Velox egy kódolót használ a téridőbeli színes pontfelhők dinamikus alakzat tokenekké történő tömörítésére, minimális bemeneti adattal dolgozva.

Az Apple Velox rendszere 4D-s objektumok geometriáját és megjelenését is rögzíti
Fotó: BoliviaInteligente / Unsplash
Forrás: Apple MLSzerző: AI Forradalom szerk.
Megosztás

Új keretrendszert mutatott be az Apple ML a 4D-s objektumok látens reprezentációinak megtanulására, amely hűen rögzíti az objektumok geometriáját és megjelenését — írja az Apple ML kutatócsoportja.

A Velox modelljei egyaránt képesek megtanulni a statikus és dinamikus 4D-s objektumok reprezentációját, ami széles körben alkalmazható a számítógépes látás területén.

A Mélytanulás Mélyvízében

A rendszer két kiegészítő dekóderrel felügyeli a tokeneket: egy 4D-s felület dekóderrel, amely a geometria időben változó felületi eloszlását modellezi, és egy Gauss-dekóderrel, amely a tokeneket 3D-s Gauss-eloszlásokra képezi le, segítve a megjelenés megtanulását.

A 4D-s Valóság Kapujában

A Velox reprezentációjának hasznosságát három különböző feladatban is tesztelték: videó-4D generálásban, 3D-s követésben és ruha szimulációban, kép-4D generálás segítségével.

Az Apple ML kutatócsoportja 2026 májusában publikálta a Velox rendszerrel kapcsolatos eredményeit a CVPR konferencián, ahol a modell erős teljesítményt mutatott a tesztfeladatokban.

Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom