Modellek & LLM2026. máj. 26.frissítve: 01:10

Norvég Nemzeti Könyvtár 2 PB Huawei flashszámmal épít saját nyelvi modellt

A projekt a norvég nyelvre szabott nagy nyelvi modell létrehozását célozza, miközben a könyvtár 20 PB egyedi digitális anyagot 3‑2‑1 biztonsági rendszerben őriz.

Fotó: Growtika / Unsplash

forrás: Hacker News·AI Forradalom szerk.·2026. május 26.

Megosztás

A 2 PB kapacitású Huawei OceanStor Dorado tömb alacsony késleltetésű tárolót biztosít a modell betanítási adatcsővezetéknek — írja a Blocks & Files.

Adattengerben úszó nyelvi modell

A könyvtár 20 PB egyedi digitális anyagot gyűjtött 2005 óta, amelyet 3‑2‑1 szabály szerint három példányban, két hordozón és egy távoli helyen tárol.

A nyelvi modell építésének alapkövei

Az adatcsővezeték első szakaszában Nvidia DGX H200 rendszer és 384 magos CPU klaszter dolgozik a tisztítási és normalizálási feladatokon.

A feldolgozott adatot a Sigma2 Olivia szuperszámítógép kapja, amely 448 GPU-val és 64 512 CPU-maggal rendelkezik.

A csapat saját értékelőeszközt fejleszt a norvég nyelv két írásmódja és dialektusai miatt, miközben a hozzáférés szabályozását is tisztázni kell.

A Sigma2 Olivia szuperszámítógép 448 GPU-val és 64 512 CPU-maggal működik, és a projekt előrehaladását 2026. május 22-én ismertették be a Huawei OceanStor Dorado tömb használatával.

tetszett a cikk? oszd meg →

Megosztás