
AI-infrastruktúrában nő Tajvan szerepe, Nvidia a középpontban a Computexen
A tajvani Computex szakkiállításon a Nvidia termékei mellett a szigetország központi és növekvő szerepe az AI-infrastruktúra kiépítésében lesz a fő téma.
Az Nvidia a mesterséges intelligencia hardveres motorja: GPU-i és AI-gyorsítói a modern AI-modellek tanításának és futtatásának alapját adják. Itt gyűjtjük az Nvidia magyar nyelvű híreit: új chipek, adatközponti megoldások és piaci lépések.
50 cikk ebben a témában

A tajvani Computex szakkiállításon a Nvidia termékei mellett a szigetország központi és növekvő szerepe az AI-infrastruktúra kiépítésében lesz a fő téma.

A Nvidia új Vera mikroprocesszorát az OpenAI, az Anthropic és a SpaceX is használja majd, erősítve a cég pozícióját az AI-adatközpontok piacán.

Május 31-én az USA Kereskedelmi Minisztériuma új szabályozást jelentett be, amely lezárja a Nvidia legfejlettebb AI-chipeinek kínai cégekhez irányuló szállítását. A lépés célja a kínai piacra történő közvetett eljutás megakadályozása.

A Nvidia legalább 6,5 milliárd dollárt fektetett optikai cégekbe 2026 márciusa óta, köztük 2 milliárd dollárt a Coherent, Lumentum és Marvell cégekbe.

A NVIDIA X-Token nevű új módszere 3.82 ponttal múlja felül a GOLD-ot a Llama-3.2-1B modellen, áthidalva a különböző tokenizátorok közötti különbségeket.

A GPU Usage Monitor egyetlen Helm chart telepítéssel biztosít átfogó képet a GPU-allokációról, számítási kihasználtságról és memóriafogyasztásról a Kubernetes-fürtökben.

A chipgyártó 20%-kal, 81,6 milliárd dollárra növelte bevételét, miközben a magáncégekben tartott részesedései megduplázódtak.

Az új képesség lehetővé teszi az ügynököknek, hogy komplex kutatási feladatokat delegáljanak egy AI-Q szervernek, majd strukturált jelentéseket kapjanak cikkekkel együtt.

A Verified Agent Skills hordozható utasításkészleteket takar, amelyek segítenek a fejlesztőknek megérteni, megbízni és biztonságosan telepíteni az AI-ügynökök képességeit.

A LoRA és DoRA technikák jelentősen csökkentik a memóriaigényt, így a modell hatékonyan finomhangolható robotmanipulációs feladatokra egyetlen GPU-val is.

A chipgyártó beszámolója mellett több kiskereskedelmi lánc, köztük a Walmart jelentése is rávilágít majd a fogyasztói kiadások alakulására.

Egy thaiföldi cég, amely Thaiföld nemzeti AI-stratégiájának központjában áll, 2024 és 2025 között körülbelül 2,5 milliárd dollár értékű, Nvidia chipekkel felszerelt szervereket juttatott Kínába, az Alibaba is az egyik végfelhasználó volt.

Az optimalizációk az Unsloth már eleve 2-5-szörös gyorsításán felül további 25%-os sebességnövekedést hoznak, az eredmények pedig pontosságvesztés nélkül érhetők el.

A NVIDIA NCCL Inspector új, valós idejű Prometheus módja folyamatosan monitorozza a GPU-k közötti kommunikációt elosztott mélytanulási feladatok során, jelentősen csökkentve a tárhelyigényt.

A FlashKDA egy nagy teljesítményű, CUTLASS-alapú kernel implementációja a Kimi Delta Attentionnek (KDA), amely MIT licenc alatt érhető el GitHubon.

Az amerikai chip-export korlátozások ellenére a kínai kereslet továbbra is rendkívül magas, ami jelentős áremelkedést okoz.

A ComfyUI három fő munkafolyamatot kínál: képek rétegekre bontását, nem kívánt tárgyak eltávolítását AI-val, valamint fotók textúrázott 3D modellekké alakítását.

Az amerikai Védelmi Minisztérium (DOD) négy technológiai céggel kötött megállapodást, hogy mesterséges intelligencia eszközeiket titkosított katonai hálózatokon alkalmazzák.

Az amerikai védelmi minisztérium a megállapodásokkal a mesterséges intelligencia „törvényes operatív felhasználását” célozza a nemzetbiztonság erősítésére.

Fejlesztők most integrálhatják a FlashQLA‑t, és akár háromszoros gyorsulást érhetnek el a GDN lineáris figyelmében NVIDIA Hopper GPU-ken.

A 6U chassi 32 Blackhole gyorsítóval, 1 TB GDDR6 memóriával és 16 TB/s memória-sávszélességgel, valamint 23 petaFLOPS FP8 teljesítménnyel érhető el $110 000-ért.

Az új architektúra a korábbi generációkhoz képest tízszer alacsonyabb következtetési költséget és tízszer nagyobb token-átvitelt biztosít megawattra vetítve.

A megállapodás keretében a Thinking Machines Lab hozzáfér a Google Cloud legújabb AI rendszereihez, amelyek a Nvidia GB300 chipjeire épülnek, jelentősen gyorsítva a modellképzést és -telepítést.

Az új eszköz a ritka adatokkal dolgozó tudományos és mélytanulási alkalmazások teljesítményét növeli, miközben a memóriakezelést rugalmasabbá teszi.

A 32 GB-os GDDR7 memóriával szerelt új GPU és a vGPU 20 szoftver jelentős teljesítménynövekedést ígér a virtualizált vállalati adatközpontoknak.

A NeMo RL könyvtárban a FP8 adatformátum bevezetése jelentősen növeli a teljesítményt a generációs és betanítási fázisokban egyaránt.

A 192GB-os SOCAMM2 modul alacsony fogyasztású LPDDR5X technológiát használ, és kulcsfontosságú eleme lesz a Nvidia következő generációs AI infrastruktúrájának.

A NVIDIA egy új, 6 millió szintetikus koreai személyiséget tartalmazó adatkészlettel segíti az AI-ügynököket, hogy jobban megértsék a helyi kulturális árnyalatokat és elkerüljék a hibás interakciókat.

Az élvonalbeli, nyílt forráskódú generatív AI modellek egyre inkább az adatközpontokból a fizikai világban működő eszközökre, az úgynevezett élre költöznek.

A Google a Broadcom és a MediaTek mellett további partnerekkel dolgozik a mesterséges intelligencia inferencia chipek fejlesztésén, jelentősen növelve a gyártási kapacitásokat.

A PyTorch MPS technológiájának köszönhetően a korábban csak NVIDIA GPU-kon futó eszköz mostantól az Apple Silicon alapú Mac számítógépeken is használható, a CUDA-specifikus műveletek teljes újraírásával.

Az új, LPDDR5X technológián alapuló modulok a hagyományos szerver RAM helyett a modern AI rendszerek egyik legnagyobb szűk keresztmetszetét orvosolhatják.

A NVIDIA egy új nyílt forráskódú referenciastackkel, a NemoClaw-val teszi lehetővé a helyi, biztonságos AI ügynökök telepítését, csökkentve az adatvédelmi kockázatokat.

A Cadence és a Nvidia kibővített partnerséget kötött, hogy a robotok szimulációs képzése hatékonyabban ültethető legyen át a fizikai valóságba.

A mesterséges intelligencia és a GPU-gyorsítás segítheti a biztonságosabb atomenergia fejlesztését, különösen a kis moduláris reaktoroknál.

A NVIDIA Dynamo platformja új funkciókkal bővült, amelyekkel az AI-ügynökök hatékonyabban írhatnak kódot, jelentősen javítva a teljesítményüket.

A Nvidia új Nemotron OCR v2 modellje jelentős pontosság- és sebességnövekedést mutat a többnyelvű optikai karakterfelismerésben, köszönhetően a szintetikus adatokkal való betanításnak.

A modell a vizuális megfigyeléseket és a természetes nyelvi utasításokat folyamatos robotműveletekké alakítja, ezzel komplex feladatok megoldására képes.

A NVIDIA egy új nyílt forráskódú projekttel, a Slinkyvel oldja meg a nagyvállalati AI-betanítás egyik kulcsfontosságú problémáját, egyesítve a Slurm és Kubernetes rendszereket.
Tetszik az oldal? Támogasd a fejlesztést
Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.