Hardver & Infra2026. ápr. 1.frissítve: 21:26

16 darab AMD MI50 GPU gyorsítja a Qwen3.5 modellt

A Qwen3.5 modell 397 milliárd paramétert tartalmaz, amihez a 16 darab AMD MI50 GPU biztosítja a számítási kapacitást.

Fotó: Fotó: Owen Miller / Unsplash

forrás: Reddit LocalLLaMA·AI Forradalom szerk.·2026. április 1.

Megosztás

16 darab AMD MI50 GPU gyorsítja a Qwen3.5 modellt

Az AMD MI50 32 GB HBM2 alapú GPU-ját 16 darab egymás után sorba állítva, a Qwen3.5 397 billion paraméteres modell betanítására használják. A konfiguráció 32 token/s (tg) átvitelsebességet és 2 000 token/s (pp) feldolgozási sebességet ér el.

Ez a beállítás a Qwen3.5 „vllm‑gfx906‑mobydick” kódrészletével fut, amely a vllm keretrendszerre épül, és a GPU-k közti kommunikációt optimalizálja.

Az MI50 32 GB változata a Vega 20 architektúrán alapul, és a 8 kbit/s memóriabandwidtht kínál, ami a mélytanulási feladatokban kritikus.

Az ilyen skálázható hardverkombináció lehetővé teszi, hogy a Qwen3.5 nagyobb promptokra reagáljon valós időben, ami a multimodális és RAG alapú alkalmazások számára előnyös.

Mi lesz a következő lépés? A Qwen3.5 fejlesztői a 2 000 token/s pp sebességét szeretnék tovább növelni, miközben a GPU-k számát is skálázzák.

tetszett a cikk? oszd meg →

Megosztás