Frissítve: 2 órája·Ma: 4
Kutatás
AI által generált szöveg

Új iTARFlow modell javítja a Normalizing Flow-k teljesítményét az ImageNeten

Az új modell end-to-end, valószínűségen alapuló célkitűzést tart fenn a betanítás során, majd autoregresszív generálást és iteratív zajszűrést alkalmaz a mintavételezéskor.

Új iTARFlow modell javítja a Normalizing Flow-k teljesítményét az ImageNeten
Fotó: National Institute of Allergy and Infectious Diseases / Unsplash
Forrás: Apple MLSzerző: AI Forradalom szerk.
Megosztás

Új generatív modellt, az iTARFlow-t mutatták be az Apple kutatói, amely jelentősen előrelépteti a Normalizing Flow (NF) alapú rendszerek képességeit. A fejlesztésről a Apple ML számolt be.

Az iTARFlow a korábbi TARFlow-n alapul, és a diffúziós modellek által inspirált iteratív zajszűrési eljárással egészíti ki a mintavételezést. Ez a megközelítés lehetővé teszi, hogy a modell versenyképes teljesítményt érjen el az ImageNet adathalmazon 64, 128 és 256 pixeles felbontásokon.

A Normalizing Flow-k újra felfedezése

A Normalizing Flow-k, bár klasszikus valószínűségen alapuló módszerek, az utóbbi időben újra reflektorfénybe kerültek. A TARFlow korábban már ígéretes eredményeket mutatott képmodellezési feladatokban, alternatívát kínálva a diffúziós modellekkel szemben.

A kutatók részletesen elemezték az iTARFlow által generált jellegzetes műtermékeket is, amelyek a jövőbeli fejlesztésekhez adhatnak támpontokat.

A modell fejlődési irányai

A modell forráskódja elérhető a GitHubon, az Apple ML oldalán pedig részletes információkat találhatunk az iTARFlow modellről, beleértve a 2024. március 15-én publikált kutatási anyagot is.

Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom