Kutatás2026. ápr. 23.frissítve: 17:10

Ellenállóbbá teszi az AI-képzést a Google DeepMind új Decoupled DiLoCo architektúrája

Az új megközelítés a képzési feladatokat „számítási szigetekre” osztja, aszinkron adatfolyamot használva, ami elszigeteli a helyi hibákat és növeli a rendszer rugalmasságát.

Fotó: Flavio Vallone / Unsplash

forrás: Google DeepMind·AI Forradalom szerk.·2026. április 23.

Megosztás

A nagyméretű nyelvi modellek (LLM-ek) képzését távoli adatközpontok között, alacsonyabb sávszélességgel és nagyobb hardveres ellenállással teszi lehetővé a Google DeepMind új Decoupled DiLoCo architektúrája — közölte a Google DeepMind.

A hagyományos AI-modellképzés szorosan összekapcsolt rendszerekre támaszkodik, ahol az azonos chipeknek szinte tökéletes szinkronban kell maradniuk. Ez a megközelítés hatékony, de a jövőbeli, egyre nagyobb modellek esetében a szinkronizáció fenntartása több ezer chip között jelentős logisztikai kihívást jelent.

A számítási szigetek új korszaka

A Decoupled DiLoCo úgy oldja meg ezt a problémát, hogy a nagyméretű képzési feladatokat „számítási szigetekre” osztja, amelyek között aszinkron adatfolyam biztosítja a kommunikációt. Ez a módszer elszigeteli a helyi zavarokat, így a rendszer többi része hatékonyan folytathatja a tanulást.

A Decoupled DiLoCo nem szenved olyan kommunikációs késedelmeket, amelyek a korábbi elosztott módszereket, mint a Data-Parallel, globális léptékben kivitelezhetetlenné tették – a DiLoCo csapat szerint.

Rugalmasság és ellenállás

Az infrastruktúra öngyógyító, mesterséges hardverhibák bevezetésekor is folytatta a képzést, majd zökkenőmentesen visszaillesztette az újra online egységeket. A Gemma 4 modellekkel végzett tesztelés során a Decoupled DiLoCo nagyobb rendelkezésre állást biztosított, mint a hagyományos képzési módszerek, miközben ugyanazt a gépi tanulási (ML) teljesítményt nyújtotta.

A csapat sikeresen képzett egy 12 milliárd paraméteres modellt négy különálló amerikai régióban, 2-5 Gbps WAN-kapcsolatot használva, ami a meglévő internet-kapcsolatokkal is elérhető. A Google DeepMind csapata Arthur Douillard vezetésével dolgozott a Decoupled DiLoCo fejlesztésén, és a modell 2024. április 15-én került bemutatásra.

tetszett a cikk? oszd meg →

Megosztás