Frissítve: 3 órája·Ma: 1
Modellek & LLM
AI által generált szöveg

Norvég Nemzeti Könyvtár 2 PB Huawei flashszámmal épít saját nyelvi modellt

A projekt a norvég nyelvre szabott nagy nyelvi modell létrehozását célozza, miközben a könyvtár 20 PB egyedi digitális anyagot 3‑2‑1 biztonsági rendszerben őriz.

Norvég Nemzeti Könyvtár 2 PB Huawei flashszámmal épít saját nyelvi modellt
Fotó: Growtika / Unsplash
Forrás: Hacker NewsSzerző: AI Forradalom szerk.
Megosztás

A 2 PB kapacitású Huawei OceanStor Dorado tömb alacsony késleltetésű tárolót biztosít a modell betanítási adatcsővezetéknek — írja a Blocks & Files.

Adattengerben úszó nyelvi modell

A könyvtár 20 PB egyedi digitális anyagot gyűjtött 2005 óta, amelyet 3‑2‑1 szabály szerint három példányban, két hordozón és egy távoli helyen tárol.

A nyelvi modell építésének alapkövei

Az adatcsővezeték első szakaszában Nvidia DGX H200 rendszer és 384 magos CPU klaszter dolgozik a tisztítási és normalizálási feladatokon.

A feldolgozott adatot a Sigma2 Olivia szuperszámítógép kapja, amely 448 GPU-val és 64 512 CPU-maggal rendelkezik.

A csapat saját értékelőeszközt fejleszt a norvég nyelv két írásmódja és dialektusai miatt, miközben a hozzáférés szabályozását is tisztázni kell.

A Sigma2 Olivia szuperszámítógép 448 GPU-val és 64 512 CPU-maggal működik, és a projekt előrehaladását 2026. május 22-én ismertették be a Huawei OceanStor Dorado tömb használatával.

Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom