Új iTARFlow modell javítja a Normalizing Flow-k teljesítményét az ImageNeten

Az új modell end-to-end, valószínűségen alapuló célkitűzést tart fenn a betanítás során, majd autoregresszív generálást és iteratív zajszűrést alkalmaz a mintavételezéskor.

Fotó: National Institute of Allergy and Infectious Diseases / Unsplash

Forrás: Apple ML•Szerző: AI Forradalom szerk.•2026. május 7.

Megosztás

Új generatív modellt, az iTARFlow-t mutatták be az Apple kutatói, amely jelentősen előrelépteti a Normalizing Flow (NF) alapú rendszerek képességeit. A fejlesztésről a Apple ML számolt be.

Az iTARFlow a korábbi TARFlow-n alapul, és a diffúziós modellek által inspirált iteratív zajszűrési eljárással egészíti ki a mintavételezést. Ez a megközelítés lehetővé teszi, hogy a modell versenyképes teljesítményt érjen el az ImageNet adathalmazon 64, 128 és 256 pixeles felbontásokon.

A Normalizing Flow-k újra felfedezése

A Normalizing Flow-k, bár klasszikus valószínűségen alapuló módszerek, az utóbbi időben újra reflektorfénybe kerültek. A TARFlow korábban már ígéretes eredményeket mutatott képmodellezési feladatokban, alternatívát kínálva a diffúziós modellekkel szemben.

A kutatók részletesen elemezték az iTARFlow által generált jellegzetes műtermékeket is, amelyek a jövőbeli fejlesztésekhez adhatnak támpontokat.

A modell fejlődési irányai

A modell forráskódja elérhető a GitHubon, az Apple ML oldalán pedig részletes információkat találhatunk az iTARFlow modellről, beleértve a 2024. március 15-én publikált kutatási anyagot is.