Frissítve: 2 órája·Ma: 15
Kutatás
AI által generált szöveg

Ellenállóbbá teszi az AI-képzést a Google DeepMind új Decoupled DiLoCo architektúrája

Az új megközelítés a képzési feladatokat „számítási szigetekre” osztja, aszinkron adatfolyamot használva, ami elszigeteli a helyi hibákat és növeli a rendszer rugalmasságát.

Ellenállóbbá teszi az AI-képzést a Google DeepMind új Decoupled DiLoCo architektúrája
Fotó: israel palacio / Unsplash
Forrás: Google DeepMindSzerző: AI Forradalom szerk.
Megosztás

A nagyméretű nyelvi modellek (LLM-ek) képzését távoli adatközpontok között, alacsonyabb sávszélességgel és nagyobb hardveres ellenállással teszi lehetővé a Google DeepMind új Decoupled DiLoCo architektúrája — közölte a Google DeepMind.

A hagyományos AI-modellképzés szorosan összekapcsolt rendszerekre támaszkodik, ahol az azonos chipeknek szinte tökéletes szinkronban kell maradniuk. Ez a megközelítés hatékony, de a jövőbeli, egyre nagyobb modellek esetében a szinkronizáció fenntartása több ezer chip között jelentős logisztikai kihívást jelent.

A számítási szigetek új korszaka

A Decoupled DiLoCo úgy oldja meg ezt a problémát, hogy a nagyméretű képzési feladatokat „számítási szigetekre” osztja, amelyek között aszinkron adatfolyam biztosítja a kommunikációt. Ez a módszer elszigeteli a helyi zavarokat, így a rendszer többi része hatékonyan folytathatja a tanulást.

A Decoupled DiLoCo nem szenved olyan kommunikációs késedelmeket, amelyek a korábbi elosztott módszereket, mint a Data-Parallel, globális léptékben kivitelezhetetlenné tették – a DiLoCo csapat szerint.

Rugalmasság és ellenállás

Az infrastruktúra öngyógyító, mesterséges hardverhibák bevezetésekor is folytatta a képzést, majd zökkenőmentesen visszaillesztette az újra online egységeket. A Gemma 4 modellekkel végzett tesztelés során a Decoupled DiLoCo nagyobb rendelkezésre állást biztosított, mint a hagyományos képzési módszerek, miközben ugyanazt a gépi tanulási (ML) teljesítményt nyújtotta.

A csapat sikeresen képzett egy 12 milliárd paraméteres modellt négy különálló amerikai régióban, 2-5 Gbps WAN-kapcsolatot használva, ami a meglévő internet-kapcsolatokkal is elérhető. A Google DeepMind csapata Arthur Douillard vezetésével dolgozott a Decoupled DiLoCo fejlesztésén, és a modell 2024. április 15-én került bemutatásra.

Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom