Frissítve: 10 perce·Ma: 39
Hardver & Infra
AI által generált szöveg

NVIDIA Jetson: Nagyobb AI modellek futnak hatékonyabban az élen

Az élvonalbeli, nyílt forráskódú generatív AI modellek egyre inkább az adatközpontokból a fizikai világban működő eszközökre, az úgynevezett élre költöznek.

NVIDIA Jetson: Nagyobb AI modellek futnak hatékonyabban az élen
Fotó: Immo Wegmann / Unsplash
Forrás: Nvidia DeveloperSzerző: AI Forradalom szerk.
Megosztás

A több milliárd paraméteres modellek hatékony futtatása a korlátozott memóriával rendelkező él-eszközökön komoly kihívást jelent. A memóriaellátás folyamatos szűkössége és a növekvő költségek miatt a fejlesztők arra összpontosítanak, hogy kevesebb erőforrással többet érjenek el.

A NVIDIA Jetson platformja támogatja a népszerű nyílt modelleket, miközben erős futásidejű teljesítményt és memóriaoptimalizálást kínál az élen. Az él-fejlesztők számára a memóriafoglalás határozza meg, hogy egy rendszer működőképes-e. A felhőalapú környezetekkel ellentétben az él-eszközök szigorú memóriakorlátok között működnek, ahol a CPU és a GPU megosztja a szűkös erőforrásokat — írja a NVIDIA Developer Blog.

A memóriaoptimalizálás javítja a teljesítményt, csökkenti a rendszerköltséget és növeli a hatékonyságot a NVIDIA szerint. Ezáltal összetettebb feladatok, például LLM-ek, többkamerás rendszerek és szenzorfúzió is lehetővé válnak.

A memóriaoptimalizálás hídja

Emellett a kisebb memóriakonfigurációkba való illeszkedés révén csökken a rendszerköltség, és a szűk keresztmetszetek minimalizálásával, valamint a GPU kihasználtságának maximalizálásával javul a hatékonyság.

A teljesítmény csúcsa

A blog öt kulcsfontosságú optimalizálási réteget vizsgál meg. Ezek az alapoktól kezdve a Jetson BSP-vel és a NVIDIA JetPackkel indulnak, majd a következtetési folyamaton, a következtetési keretrendszereken és a kvantálási technikákon keresztül haladnak felfelé.

A NVIDIA Jetson és a NVIDIA IGX platformok 2024-ben várhatóak, hogy további teljesítménynövekedést érjenek el a fejlesztők számára.

Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom