Új AI-modell tömöríti az orvosi idősorokat: k-ujjlenyomat tokent használ
A modell a változó hosszúságú orvosi idősorokat rögzített méretű, k darab latens ujjlenyomat tokenné alakítja, ezzel kiküszöbölve a zajt és a magas dimenziót.

Jelentős kihívást jelent az orvosi idősorokból, például EKG- vagy EEG-jelekből származó értelmes reprezentációk megtanulása. Ezek a jelek gyakran magas dimenziójúak, változó hosszúságúak és tele vannak zajjal. A meglévő önszupervíziós megközelítések, mint a Masked Autoencoderek (MAE), hatékonyak az általános célú enkóderek előzetes betanítására — írja az ArXiv.
Azonban ezek a módszerek nem tanulnak explicit módon kompakt és szemantikailag értelmezhető latens reprezentációkat, jellemzően heurisztikus aggregációs stratégiákra, például globális átlagolásra vagy kijelölt [CLS] tokenre támaszkodnak. Ezt a hiányosságot orvosolja az új keretrendszer.
A tanulmány egy új keretrendszert javasol, amely egy változó hosszúságú orvosi idősort rögzített méretű, k darab latens Fingerprint Tokenné tömörít. Az architektúra kereszt-figyelmi szűk keresztmetszetet (cross-attention bottleneck) alkalmaz ezen tokenek generálására, és kettős célfüggvénnyel képzik.
Az első cél a rekonstrukciós veszteség, amely biztosítja, hogy a tokenek elegendő statisztikát tartalmazzanak az eredeti adatokhoz. A második cél a diverzitás maximalizálása, ami a tokenek közötti redundancia csökkentését célozza, így egyedi és informatív reprezentációkat hozva létre a MedTS adatokból.