ÉlőUtoljára: 14 perceMa: 5

Rovat · 3. oldal

Hardver & Infra

AI chipek (Nvidia, Google TPU), adatközpontok, edge computing

110 cikk az archívumban

2,8-szoros gyorsulást ígér a Google új TPU 8 chipje a képzésben
Hardver & Infra

2,8-szoros gyorsulást ígér a Google új TPU 8 chipje a képzésben

A Google a Cloud Next konferencián mutatta be a képzésre optimalizált TPU 8t és az inferenciára szánt TPU 8i gyorsítókat, melyekkel jelentősen növelheti a LLM-ek hatékonyságát.

The Register·AI
Anthropic: Londonból irányítják az európai adatközponti terjeszkedést
Hardver & Infra

Anthropic: Londonból irányítják az európai adatközponti terjeszkedést

Az amerikai AI-óriás eddig kizárólag felhőszolgáltatókkal dolgozott, most azonban önálló nemzetközi infrastruktúrát épít ki.

The Decoder·AI
SK hynix: 192GB SOCAMM2 tömeggyártása indul a Nvidia Rubin platformjához
Hardver & Infra

SK hynix: 192GB SOCAMM2 tömeggyártása indul a Nvidia Rubin platformjához

A 192GB-os SOCAMM2 modul alacsony fogyasztású LPDDR5X technológiát használ, és kulcsfontosságú eleme lesz a Nvidia következő generációs AI infrastruktúrájának.

Techmeme·AI
NVIDIA Jetson: Nagyobb AI modellek futnak hatékonyabban az élen
Hardver & Infra

NVIDIA Jetson: Nagyobb AI modellek futnak hatékonyabban az élen

Az élvonalbeli, nyílt forráskódú generatív AI modellek egyre inkább az adatközpontokból a fizikai világban működő eszközökre, az úgynevezett élre költöznek.

Nvidia Developer·AI
Google új AI chipekkel erősít: inference TPU érkezik a héten
Hardver & Infra

Google új AI chipekkel erősít: inference TPU érkezik a héten

A Google a héten, egy Las Vegas-i konferencián mutathatja be az inference feladatokra, vagyis a betanított AI modellek futtatására szánt új TPU chipjeit.

Bloomberg Technology·AI
A Google négy partnerrel épít chipellátási láncot a Nvidia kihívására
Hardver & Infra

A Google négy partnerrel épít chipellátási láncot a Nvidia kihívására

A Google a Broadcom és a MediaTek mellett további partnerekkel dolgozik a mesterséges intelligencia inferencia chipek fejlesztésén, jelentősen növelve a gyártási kapacitásokat.

TNW·AI
Londonból vidékre költözhetnek a brit AI adatközpontok az energiahiány miatt
Hardver & Infra

Londonból vidékre költözhetnek a brit AI adatközpontok az energiahiány miatt

A brit AI adatközpont-kapacitás jelentős része elvándorolhat Londonból, mivel a fővárosban egyre nehezebb megfelelő áramellátást és építési telket találni.

The Register·AI
SK hynix 192 GB-os modullal gyorsítja a NVIDIA AI szervereit
Hardver & Infra

SK hynix 192 GB-os modullal gyorsítja a NVIDIA AI szervereit

Az új, LPDDR5X technológián alapuló modulok a hagyományos szerver RAM helyett a modern AI rendszerek egyik legnagyobb szűk keresztmetszetét orvosolhatják.

Reddit LocalLLaMA·AI
Kamionra szerelhető adatközpontokkal gyorsítják az AI-telepítést a Duos Edge AI és a LG CNS
Hardver & Infra

Kamionra szerelhető adatközpontokkal gyorsítják az AI-telepítést a Duos Edge AI és a LG CNS

A hagyományos adatközpontok lassú építése miatt a Duos Edge AI és a LG CNS előregyártott, konténer-szerű egységekkel gyorsítaná fel az AI-hardverek telepítését, akár 576 Nvidia GPU-t is befogadva egyetlen modulban.

IEEE Spectrum AI·AI
Az AI-boom hajtja a rézkeresletet, miközben az USA termelése évtizedek óta stagnál
Hardver & Infra

Az AI-boom hajtja a rézkeresletet, miközben az USA termelése évtizedek óta stagnál

A réz iránti megnövekedett kereslet az adatközpontok és az elektromos hálózatok kiépítésének felgyorsulásához is kapcsolódik, hiszen a réz kulcsfontosságú alapanyag az energiaellátásukhoz.

Bloomberg Technology·AI
Az Intel Wildcat Lake chipek 40 TOPS AI-teljesítménnyel támadnak a MacBook Neo ellen
Hardver & Infra

Az Intel Wildcat Lake chipek 40 TOPS AI-teljesítménnyel támadnak a MacBook Neo ellen

Április 16-án mutatta be az Intel a Wildcat Lake processzorait, amelyek 40 TOPS AI-teljesítménnyel rendelkeznek. A chipek a Windows ökoszisztémára és megnövelt AI-képességekre fókuszálnak.

TNW·AI
Az amerikai adatközpontok 40%-a késik, az OpenAI és a Microsoft is érintett
Hardver & Infra

Az amerikai adatközpontok 40%-a késik, az OpenAI és a Microsoft is érintett

Az amerikai adatközpont-projektek jelentős része, mintegy 40%-a, csúszásban van, ami komoly kihívás elé állítja az iparágat.

Techmeme·AI
A NVIDIA Slinkyvel integrálja a Slurmot Kubernetesbe, 1000+ GPU-s klasztereken
Hardver & Infra

A NVIDIA Slinkyvel integrálja a Slurmot Kubernetesbe, 1000+ GPU-s klasztereken

A NVIDIA egy új nyílt forráskódú projekttel, a Slinkyvel oldja meg a nagyvállalati AI-betanítás egyik kulcsfontosságú problémáját, egyesítve a Slurm és Kubernetes rendszereket.

Nvidia Developer·AI
Az amerikai adatközpontok 40%-át fenyegeti késés, az AI-projektek is lassulhatnak
Hardver & Infra

Az amerikai adatközpontok 40%-át fenyegeti késés, az AI-projektek is lassulhatnak

Ezek a fennakadások a mesterséges intelligencia fejlesztéséhez kulcsfontosságú infrastruktúra kiépítését is hátráltatják, így az AI-iparág terjeszkedése is lassulhat.

Financial Times·AI
Az AI írhatja át a Nvidia szoftverelőnyét a chiptervezésben
Hardver & Infra

Az AI írhatja át a Nvidia szoftverelőnyét a chiptervezésben

Ez a technológia lehetővé teszi, hogy a fejlesztők gyorsabban és hatékonyabban hozzanak létre olyan szoftvereket, amelyek kihasználják a szilíciumchipek egyedi tulajdonságait, ami új lehetőségeket teremthet az AI-fejlesztésben.

Wired·AI
Nvidia: 1 billió dollár feletti bevételt vár AI chipekből 2027 végéig
Hardver & Infra

Nvidia: 1 billió dollár feletti bevételt vár AI chipekből 2027 végéig

A vállalat korábbi becsléseit jelentősen felülmúló új előrejelzés mögött az AI chipek iránti növekvő kereslet és a technológia gyors fejlődése áll.

Ben's Bites·AI
Diszaggregált inferencia: 2-4x-es költségcsökkentés a LLM-ek futtatásánál
Hardver & Infra

Diszaggregált inferencia: 2-4x-es költségcsökkentés a LLM-ek futtatásánál

Ezt a költségcsökkentést egy olyan új architektúra segítségével lehet elérni, amely szétválasztja a számításigényes és a memóriakorlátos feladatokat, és így hatékonyabban használja ki a rendelkezésre álló erőforrásokat.

Towards Data Science·AI
Zsugorodik az OpenAI Stargate terve: Microsoft és Google kapja a kapacitásokat
Hardver & Infra

Zsugorodik az OpenAI Stargate terve: Microsoft és Google kapja a kapacitásokat

Az OpenAI eredeti, ambiciózus európai Stargate adatközpont-tervei jelentősen csökkentek, a cég nem tartja magát a korábbi elképzelésekhez.

The Decoder·AI
A chipek hőkezelése kulcsfontosságúvá vált az új architektúrákban
Hardver & Infra

A chipek hőkezelése kulcsfontosságúvá vált az új architektúrákban

Az egyre vékonyabb rétegekkel és komplex anyagokkal épülő, háromdimenziós chipekben a hőáramlás szabályozása ma már alapvető tervezési szemponttá vált.

IEEE Spectrum AI·AI
Régi telefonok kelnek életre: AI szerverként kapnak új feladatot
Hardver & Infra

Régi telefonok kelnek életre: AI szerverként kapnak új feladatot

Több ezer felhasználó alakítja át régi mobiltelefonját otthoni AI szerverré, kihasználva azok alacsony fogyasztású processzorait és beépített akkumulátorait.

Reddit LocalLLaMA·AI
Az OpenAI felfüggesztette a brit Stargate adatközpont-projektet a magas energiaárak miatt
Hardver & Infra

Az OpenAI felfüggesztette a brit Stargate adatközpont-projektet a magas energiaárak miatt

Az OpenAI szünetelteti Stargate projektjét az Egyesült Királyságban, mert a magas energiaárak és szabályozási környezet miatt nem térül meg a beruházás.

Bloomberg Technology·AI

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom