NVIDIA bevezeti a CUDA Tile C++ támogatást a 13.3‑as verzióban
A fejlesztők most C++‑ban írhatnak tile‑alapú GPU‑kerneleket a CUDA 13.3‑as frissítéssel, anélkül, hogy explicit szálkezelést kellene végezniük.

A CUDA 13.3‑as kiadás már tartalmazza a CUDA Tile C++ programozási modellt — írja a NVIDIA Developer Blog.
A Tile Új Korszaka
A szálkezelés elrejtése a tile‑modellben lehetővé teszi, hogy a fejlesztők a párhuzamos számításokat magasabb szinten definiálják, anélkül, hogy az egyes szálak részleteit kezelniük kellene.
Tile Alapú Architektúra
A modell többdimenziós tensor span‑okat és partition view‑kat használ a rögzített méretű tömbdarabok (tile‑ek) kezelésére; a kernel egyetlen szálból indítható blokkban, a fordító gondoskodik a szálak futtatásáról.
A NVIDIA szerint a __restrict__ kvalifikátorok, a 16‑byte igazítás és a maszkolt betöltés/tárolás javíthatja a teljesítményt és a memóriahatékonyságot — írja a NVIDIA Developer Blog.
A funkció csak a compute capability 8.x vagy újabb GPU‑kon, a R580‑as driverrel és a CUDA Toolkit 13.3‑as vagy újabb verzióval érhető el.
A támogatás a 2026. május 26‑án közzétett CUDA 13.3‑as verzióval válik elérhetővé az NVIDIA GeForce RTX 4080‑on.