BioNeMo CP keretrendszer lineáris skálázást ígér 10 000 reziduumú komplexumokra
A kutatók most már több H100 vagy B200 GPU-n modellezhetik a 1 000–3 000 aminosav közötti biomolekulákat, miközben a globális kontextust megtartják.

A kontextus-parallelizáció (CP) keretrendszer a BioNeMo-ban áttöri a memóriakorlátokat, így a teljes biomolekulát több GPU között osztja szét — írja a NVIDIA Developer Blog.
Miért szükséges a CP?
A hagyományos szekciós darabolás vagy a chunking módszerek elveszítik a hosszú távú kölcsönhatásokat, ezért a nagy fehérjék modellezése pontatlan marad.
Hogyan működik a sharding?
A CP többdimenziós shardingot alkalmaz, a N×N interakciós mátrixot rácsra bontja, így egy 10 000 reziduumos komplexum esetén minden GPU csak egy alblokkot kezel, a memóriaigény O(N²/P)-re csökken.
A keretrendszer hatékony működéséhez NVIDIA H100 vagy B200 GPU klaszter szükséges, és a Torch Distributed API‑kat, valamint a Transformer Engine‑t használja a gyors adatcseréhez.
A FastFold vagy a Boltz által alkalmazott chunking technikákkal szemben a CP megőrzi a globális kontextust, bár a lineáris kapacitás‑skálázásra vonatkozó állítások még nem függetlenül tesztelték.
A BioNeMo CP keretrendszer már elérhető a NVIDIA fejlesztői portálon, és 2024. májusban kerül kiadásra a H100/B200 klaszterekre.