Norvég Nemzeti Könyvtár 2 PB Huawei flashszámmal épít saját nyelvi modellt
A projekt a norvég nyelvre szabott nagy nyelvi modell létrehozását célozza, miközben a könyvtár 20 PB egyedi digitális anyagot 3‑2‑1 biztonsági rendszerben őriz.

A 2 PB kapacitású Huawei OceanStor Dorado tömb alacsony késleltetésű tárolót biztosít a modell betanítási adatcsővezetéknek — írja a Blocks & Files.
Adattengerben úszó nyelvi modell
A könyvtár 20 PB egyedi digitális anyagot gyűjtött 2005 óta, amelyet 3‑2‑1 szabály szerint három példányban, két hordozón és egy távoli helyen tárol.
A nyelvi modell építésének alapkövei
Az adatcsővezeték első szakaszában Nvidia DGX H200 rendszer és 384 magos CPU klaszter dolgozik a tisztítási és normalizálási feladatokon.
A feldolgozott adatot a Sigma2 Olivia szuperszámítógép kapja, amely 448 GPU-val és 64 512 CPU-maggal rendelkezik.
A csapat saját értékelőeszközt fejleszt a norvég nyelv két írásmódja és dialektusai miatt, miközben a hozzáférés szabályozását is tisztázni kell.
A Sigma2 Olivia szuperszámítógép 448 GPU-val és 64 512 CPU-maggal működik, és a projekt előrehaladását 2026. május 22-én ismertették be a Huawei OceanStor Dorado tömb használatával.