A Z.ai bevezeti a GLM-5V-Turbo modellt, amely 200K kontextusablakot képes feldolgozni
A kínai Z.ai bemutatta a GLM-5V-Turbo modellt: 200 000 tokenes kontextusablak, megerősítéses tanulással fejlesztve, STEM-oktatástól videóanalízisig 30 feladattípust kezel.

Z.ai bejelentette a GLM-5V-Turbo modellt, amely 200 000 szekvenciaablakot képes kezelni. A modell 30+ feladatot egyesítő megerősített tanulással épült, és a STEM‑oktatást, videóanalízist, valamint szoftvereszközök használatát öleli fel. A fejlesztés során a CogViT vizuális kódolót és az MTP (Multi‑Token Prediction) architektúrát alkalmazták, hogy a kódgenerálás hatékonysága és a vizuális hierarchiák megmaradjanak.
A 200 000 kontextusablak lehetővé teszi, hogy a modell hosszú technikai dokumentumokat vagy részletes videófelvételeket dolgozzon fel, miközben hosszú kódsorokat generál. Ez a kapacitás különösen előnyös a GUI‑agentek számára, akiknek a képernyőn lévő elemek pontos koordinátáit és tulajdonságait kell értelmezniük.
Az új modellel a Z.ai célja, hogy a vizuális és programozási képességeket egyetlen, natív multimodális kódkövető keretrendszerben ötvözze. A CogViT és MTP kombinációja csökkenti a tokenek közötti felesleges átalakítást, így a kódfeladatok gyorsabbak és pontosabbak lesznek.
Az integrációt az OpenClaw és a Claude Code ökoszisztémákba építették, amelyeket a modellel mélyen adaptálni lehet. Az OpenClaw‑ban a modell automatizálhatja a környezettelepítést és a kódgenerálást, míg a Claude Code‑ban a vizuálisan alapuló kódjavaslatok segítik a hibakeresést és a fejlesztői prototípusok gyors kidolgozását.
Jelenleg a Z.ai a GLM‑5V‑Turbo-t a ZClawBench és a ClawEval benchmarkokkal ellenőrizte, ahol a modell vezető teljesítményt mutat a multimodális kódolás és a GUI‑interakció terén. A következő lépés: a model finomhangolása valós idejű, valós környezetű agentic munkafolyamatokhoz, amelyeket a Z.ai 2026. júniusában tervez publikálni.