A Midjourney képgenerátora szép képeket készít, de nem követi az utasításokat
A Midjourney képgenerátorának pontos utasításokat követő képességének hiányára a Tech Xplore oldalán megjelent tanulmány hívja fel a figyelmet

A Midjourney képgenerátora esetében a Tech Xplore oldalán megjelent tanulmány szerint a pontos utasításokat követő képesség hiányzik. A tanulmány megállapítja, hogy a képgenerátorok képesek szép és esztétikailag sikeres képeket készíteni, de nem tudják követni az alapvető utasításokat.
Az az úgynevezett generatív adversariális hálózat (GAN) használatát a képgenerátorokban a kutatók szerint az teszi lehetővé, hogy a gép tanuljon egy adott esztétikát az adathalmaz elemzésével. Azonban ez a megközelítés bizonyos korlátokat is tartalmaz, mint például a felszínes statisztikákra való torzítás.
Az AI-képalkotás terén végzett kutatások azt mutatják, hogy amikor a résztvevők AI-képeket látnak az agytröszt-szessionok alatt, saját ötleteik gyakran csoportosulnak ezek köré, egy olyan jelenség, amely a kreativitás korlátozottságát jelzi.
Az AI-képgenerátorok által készített képek esztétikai sikerét az az OpenAI szerint az teszi lehetővé, hogy a gép képes megtanulni a datasetsben található mintákat és azokat alkalmazni. Ugyanakkor a gép képtelensége, hogy alapvető utasításokat kövessen, további kutatásokat és fejlesztéseket igényel a területen.
Mi lesz a következő lépés a Midjourney képgenerátorának fejlesztésében, és hogyan lehetne megoldani a pontos utasításokat követő képesség hiányát? A válasz erre a kérdésre várhatóan a további kutatások és fejlesztések eredményeként fog megjelenni.