Kutatás2026. ápr. 3.frissítve: 00:25

A Midjourney képgenerátora szép képeket készít, de nem követi az utasításokat

A Midjourney képgenerátorának pontos utasításokat követő képességének hiányára a Tech Xplore oldalán megjelent tanulmány hívja fel a figyelmet

Fotó: Fotó: Amos K / Unsplash

forrás: Midjourney·AI Forradalom szerk.·2026. április 3.

Megosztás

A Midjourney képgenerátora esetében a Tech Xplore oldalán megjelent tanulmány szerint a pontos utasításokat követő képesség hiányzik. A tanulmány megállapítja, hogy a képgenerátorok képesek szép és esztétikailag sikeres képeket készíteni, de nem tudják követni az alapvető utasításokat.

Az az úgynevezett generatív adversariális hálózat (GAN) használatát a képgenerátorokban a kutatók szerint az teszi lehetővé, hogy a gép tanuljon egy adott esztétikát az adathalmaz elemzésével. Azonban ez a megközelítés bizonyos korlátokat is tartalmaz, mint például a felszínes statisztikákra való torzítás.

Az AI-képalkotás terén végzett kutatások azt mutatják, hogy amikor a résztvevők AI-képeket látnak az agytröszt-szessionok alatt, saját ötleteik gyakran csoportosulnak ezek köré, egy olyan jelenség, amely a kreativitás korlátozottságát jelzi.

Az AI-képgenerátorok által készített képek esztétikai sikerét az az OpenAI szerint az teszi lehetővé, hogy a gép képes megtanulni a datasetsben található mintákat és azokat alkalmazni. Ugyanakkor a gép képtelensége, hogy alapvető utasításokat kövessen, további kutatásokat és fejlesztéseket igényel a területen.

Mi lesz a következő lépés a Midjourney képgenerátorának fejlesztésében, és hogyan lehetne megoldani a pontos utasításokat követő képesség hiányát? A válasz erre a kérdésre várhatóan a további kutatások és fejlesztések eredményeként fog megjelenni.

tetszett a cikk? oszd meg →

Megosztás