PhyDrawGen: Fizikai pontossággal rajzolja le a tudományos problémákat az AI
A fizikai törvényeket betartó tudományos ábrákat generáló PhyDrawGen neuro-szimbolikus AI-folyamat képes a hibátlan geometriai és fizikai pontosságra, szemben a korábbi modellekkel.

Az új PhyDrawGen rendszer neuro-szimbolikus megközelítéssel generál fizikai törvényeknek megfelelő tudományos ábrákat szöveges leírások alapján. A korábbi generatív modellek gyakran hibáztak a vektoroknál, figyelmen kívül hagyták a konzervációs törvényeket és megsértették a geometriai megkötéseket, ám a PhyDrawGen ezeket orvosolja — írja az arXiv.
A rendszer egy nagy nyelvi modell segítségével először egy típusos scene graph-ot von ki a problémaleírásból. Ezt követően egy determinisztikus solver alakítja át a grafikont egy Planar Straight-Line Graph (PSLG) formátummá, amely pontos geometriai primitívekként kódolja az erőegyensúlyt, az optikai utakat és a mezők topológiáját.
Kapcsolódó: Mozgó tárgyak csoportosítása
A pontosság szövete
A folyamat végső lépéseként egy finomhangolt Qwen-VL modell hajt végre egy vizuálisan megalapozott javasol-ellenőriz ciklust. Ez iteratív módon korrigálja az esetlegesen felmerülő fizikai vagy geometriai hibákat, biztosítva az ábra pontosságát.
Kapcsolódó: 3D-s jelenetszintézis
A tesztek tükrében
A mechanika, optika és az elektromágnesesség témakörében 1449 problémát tartalmazó teljesítményteszten tesztelt PhyDrawGen szignifikánsan felülmúlja a GPT-5-image, a Gemini 2.5 Flash és a Gemini 3 Pro modelljeit. A PhyDrawGen a Qwen-VL modell segítségével 2024. március 10-én publikált eredményeit az arXiv oldalán közzétették.
Kapcsolódó: Emberi mozgás generálása