Új iTARFlow modell javítja a Normalizing Flow-k teljesítményét az ImageNeten
Az új modell end-to-end, valószínűségen alapuló célkitűzést tart fenn a betanítás során, majd autoregresszív generálást és iteratív zajszűrést alkalmaz a mintavételezéskor.

Új generatív modellt, az iTARFlow-t mutatták be az Apple kutatói, amely jelentősen előrelépteti a Normalizing Flow (NF) alapú rendszerek képességeit. A fejlesztésről a Apple ML számolt be.
Az iTARFlow a korábbi TARFlow-n alapul, és a diffúziós modellek által inspirált iteratív zajszűrési eljárással egészíti ki a mintavételezést. Ez a megközelítés lehetővé teszi, hogy a modell versenyképes teljesítményt érjen el az ImageNet adathalmazon 64, 128 és 256 pixeles felbontásokon.
A Normalizing Flow-k újra felfedezése
A Normalizing Flow-k, bár klasszikus valószínűségen alapuló módszerek, az utóbbi időben újra reflektorfénybe kerültek. A TARFlow korábban már ígéretes eredményeket mutatott képmodellezési feladatokban, alternatívát kínálva a diffúziós modellekkel szemben.
A kutatók részletesen elemezték az iTARFlow által generált jellegzetes műtermékeket is, amelyek a jövőbeli fejlesztésekhez adhatnak támpontokat.
A modell fejlődési irányai
A modell forráskódja elérhető a GitHubon, az Apple ML oldalán pedig részletes információkat találhatunk az iTARFlow modellről, beleértve a 2024. március 15-én publikált kutatási anyagot is.