Hardver & Infra2026. ápr. 23.frissítve: 20:50

Tízszeres költségcsökkentést ígér az NVIDIA és a Google új AI-infrastruktúrája

Az új architektúra a korábbi generációkhoz képest tízszer alacsonyabb következtetési költséget és tízszer nagyobb token-átvitelt biztosít megawattra vetítve.

Fotó: Bartosz Kwitkowski / Unsplash

forrás: AI News·AI Forradalom szerk.·2026. április 23.

Megosztás

Az NVIDIA és a Google közös hardver- és szoftverfejlesztéssel célozza meg az AI következtetési költségeinek csökkentését — írja az Artificial Intelligence News. A Google Cloud Next konferencián részletezték az együttműködés kereteit.

A partnerek új A5X bare-metal instance-eket mutattak be, amelyek NVIDIA Vera Rubin NVL72 rack-scale rendszereken futnak. Ez az architektúra a hardver és szoftver összehangolt tervezésével jelentős előrelépést hoz az AI-modellek futtatásában.

A feldolgozási késedelmek elkerülése érdekében az A5X instance-ek NVIDIA ConnectX-9 SuperNIC-eket és Google Virgo hálózati technológiát használnak. Ez a konfiguráció akár 80 000 NVIDIA Rubin GPU-ra skálázható egyetlen adatközponton belül, és akár 960 000 GPU-ra is több telephelyen keresztül.

Az integráció szövevénye

Mark Lohmeyer, a Google Cloud AI és számítási infrastruktúrájának alelnöke szerint az elkövetkező évtizedet az ügyfelek azon képessége fogja meghatározni, hogy a legigényesebb AI-munkafolyamataikat valóban integrált, AI-optimalizált infrastruktúrán futtassák.

A hatékonyság fokozása

A Google Cloud és az NVIDIA platformjainak kombinációja rugalmasságot biztosít a modellek betanításához és futtatásához, miközben optimalizálja a teljesítményt, a költségeket és a fenntarthatóságot. Az NVIDIA és a Google együttműködése 2024. év végére tervezett NVIDIA Vera Rubin NVL72 rendszerek széles körű bevezetését eredményezi.

tetszett a cikk? oszd meg →

Megosztás