AI-karakterek egységes személyiségét hozza létre az UniCharacter — 10 képpel tanul
A modell mindössze 10 kép és a hozzá tartozó interakciós példák alapján képes elsajátítani a célkaraktert, és koherens személyiséget, stílust és vizuális identitást mutat mind a generált szövegben, mind a képben.

Új módszert dolgoztak ki kutatók a mesterséges intelligencia karakterek személyiségének, stílusának és vizuális identitásának egységes testreszabására, amely áthidalja a multimodális konzisztencia eddig feltáratlan hiányosságait — írja az arXiv előnyomtatott tanulmánya.
A kutatás egy új feladatot vezet be, az úgynevezett Customized Multimodal Role-Play (CMRP) rendszert. Ez a megközelítés lehetővé teszi, hogy az AI-modellek ne csak szövegben, hanem vizuálisan is egységes, testreszabott karaktereket hozzanak létre, ami gazdagabb ember-AI interakciót tesz lehetővé.
A munka részeként létrehozták a RoleScape-20 adatkészletet, amely 20 különböző karaktert tartalmaz. Ez az adathalmaz részletes tréning- és értékelési adatokat foglal magában, lefedve a karakterek személyiségét, stiláris leírásait, vizuális és expresszív jegyeit, valamint a szöveg-kép interakciókat.
A kutatók az UniCharacter nevű modellt is bemutatták, amely egy kétlépcsős képzési eljárást alkalmaz. Ez a keretrendszer magában foglalja a Unified Supervised finomhangolás (Unified-SFT) és a karakter-specifikus csoportos relatív irányelv-optimalizálás (Character-GRPO) fázisait. Az UniCharacter célja, hogy a modell hatékonyan tanulja meg a karakterek komplex jellemzőit.
A modell mindössze 10 kép és a hozzá tartozó interakciós példák alapján képes elsajátítani a célkaraktert, és koherens személyiséget, stílust és vizuális identitást mutat mind a generált szövegben, mind a képben, a kutatók szerint. A tanulmány az arXiv:2605.08129v1 azonosító alatt érhető el.