Az Alibaba Qwen 3.6-35B-A3B modellje új szintre emeli a multimodális AI-t
Az Alibaba Qwen 3.6-35B-A3B modellje valós munkafolyamatokban is bevethető, modern multimodális MoE képességeket kínál a fejlesztőknek.

Végponttól végpontig terjedő implementációt mutat be egy friss útmutató az Alibaba Qwen 3.6-35B-A3B modelljéhez, amely feltárja, hogyan használható egy modern multimodális MoE modell a gyakorlati munkafolyamatokban — írja az AIDeveloper44.
A modell futtatásához legalább 40 GB VRAM szükséges int8 módban, de bf16 módban 75 GB VRAM ajánlott. Az újrahasználható csevegő keretrendszer támogatja a standard válaszokat és az explicit gondolkodási nyomkövetést is.
A multimodális AI új távlatokban
A Qwen 3.6-35B-A3B számos fontos képességet demonstrál, többek között a gondolkodási költségvetés-szabályozást, a streamelt generálást elkülönített érveléssel és válaszokkal, a vizuális bemenetek kezelését, az eszközhívást és a strukturált JSON generálást.
A modell futtatása során az útmutató azt is vizsgálja, hogyan lehet robusztus alkalmazásréteget tervezni a Qwen 3.6 tetejére a valós kísérletezés és a fejlett prototípus-készítés érdekében. A Qwen 3.6-35B-A3B modell betöltését 2024. március 15-én kezdték meg.
Gyakorlati alkalmazások és képességek feltárása
A Qwen 3.6-35B-A3B modell bemutatja a MoE routing ellenőrzését, a benchmarkingot, a retrieval-augmented generation (RAG) funkciót és a munkamenet-perzisztenciát is. A modell fejlesztése az Alibaba által történt, 2024. március 20-án.