Kutatás2026. máj. 5.frissítve: 08:30

Új AI-modell tömöríti az orvosi idősorokat: k-ujjlenyomat tokent használ

A modell a változó hosszúságú orvosi idősorokat rögzített méretű, k darab latens ujjlenyomat tokenné alakítja, ezzel kiküszöbölve a zajt és a magas dimenziót.

Fotó: Vitaly Gariev / Unsplash

forrás: ArXiv ML·AI Forradalom szerk.·2026. május 5.

Megosztás

Jelentős kihívást jelent az orvosi idősorokból, például EKG- vagy EEG-jelekből származó értelmes reprezentációk megtanulása. Ezek a jelek gyakran magas dimenziójúak, változó hosszúságúak és tele vannak zajjal. A meglévő önszupervíziós megközelítések, mint a Masked Autoencoderek (MAE), hatékonyak az általános célú enkóderek előzetes betanítására — írja az ArXiv.

Azonban ezek a módszerek nem tanulnak explicit módon kompakt és szemantikailag értelmezhető latens reprezentációkat, jellemzően heurisztikus aggregációs stratégiákra, például globális átlagolásra vagy kijelölt [CLS] tokenre támaszkodnak. Ezt a hiányosságot orvosolja az új keretrendszer.

A tanulmány egy új keretrendszert javasol, amely egy változó hosszúságú orvosi idősort rögzített méretű, k darab latens Fingerprint Tokenné tömörít. Az architektúra kereszt-figyelmi szűk keresztmetszetet (cross-attention bottleneck) alkalmaz ezen tokenek generálására, és kettős célfüggvénnyel képzik.

Az első cél a rekonstrukciós veszteség, amely biztosítja, hogy a tokenek elegendő statisztikát tartalmazzanak az eredeti adatokhoz. A második cél a diverzitás maximalizálása, ami a tokenek közötti redundancia csökkentését célozza, így egyedi és informatív reprezentációkat hozva létre a MedTS adatokból.

tetszett a cikk? oszd meg →

Megosztás