Ezt a költségcsökkentést egy olyan új architektúra segítségével lehet elérni, amely szétválasztja a számításigényes és a memóriakorlátos feladatokat, és így hatékonyabban használja ki a rendelkezésre álló erőforrásokat.
Towards Data Science
52 cikk összesen (szűrt)
Ezt a költségcsökkentést egy olyan új architektúra segítségével lehet elérni, amely szétválasztja a számításigényes és a memóriakorlátos feladatokat, és így hatékonyabban használja ki a rendelkezésre álló erőforrásokat.
Towards Data Science
Az OpenAI eredeti, ambiciózus európai Stargate adatközpont-tervei jelentősen csökkentek, a cég nem tartja magát a korábbi elképzelésekhez.
The Decoder
Az egyre vékonyabb rétegekkel és komplex anyagokkal épülő, háromdimenziós chipekben a hőáramlás szabályozása ma már alapvető tervezési szemponttá vált.
IEEE Spectrum AI
Több ezer felhasználó alakítja át régi mobiltelefonját otthoni AI szerverré, kihasználva azok alacsony fogyasztású processzorait és beépített akkumulátorait.
Reddit LocalLLaMA
Az OpenAI szünetelteti Stargate projektjét az Egyesült Királyságban, mert a magas energiaárak és szabályozási környezet miatt nem térül meg a beruházás.
Bloomberg Technology
A félvezetőgyártók kulcsfontosságúak az AI-boom tőkebefektetéseinek felgyorsulásában, mivel a mesterséges intelligencia infrastruktúrája nem épülhet fel nélkülük.
Bloomberg Technology
Az új szoftveres megoldás a NVIDIA Grace Blackwell NVL72 rendszerek vezérlését teszi lehetővé, integrálva a Slurm és a Run:ai platformokat.
Nvidia Developer
A TechCrunch beszámolója szerint a Workbench-et a „AI-korszakra” tervezték, és az Apple eszközökkel való kompatibilitása miatt különösen nagy érdeklődés övezi.
TechCrunch
A kaliforniai székhelyű vállalat kedden jelentette be, hogy bővíti az Amazon felhőszolgáltatásait, és az AWS Graviton chipjeit használja a fuvarmegosztó funkciókhoz.
TechCrunch
Az Intel az Austinban épülő félvezetőgyár tervezésében és kivitelezésében is részt vesz, amely a SpaceX és a Tesla mesterséges intelligencia chipjeit gyártja majd.
The Verge
A dél-koreai gyártó működési nyeresége 57,2 billió vonra, azaz 37,9 milliárd dollárra ugrott az első negyedévben, ezzel rekordot döntött.
Bloomberg Technology
Az AI-adatközpontok memóriachipek iránti „falánk étvágya” miatt az amerikai áramfogyasztás 2028-ra elérheti az országos fogyasztás 12 százalékát.
IEEE Spectrum AI
A fenyegetés mögött az Egyesült Államok és Irán közötti fokozódó feszültség áll, ami az amerikai és iráni érdekek ütközésével jár a régióban.
The Verge
A technológiai óriás az AI-chipekhez elengedhetetlen, fejlett chipcsomagolási technológiájával a Google-t és az Amazont is megcélozza, milliárdos bevételre számítva.
Wired
A modern, kompakt LLM-ek már pontosan és gyorsan futnak 16 GB VRAM-mal, kompromisszumok nélkül.
Reddit LocalLLaMA
A Nvidia új radar-feldolgozó architektúrája 30%-kal csökkenti a költségeket, 20%-kal a méretet és 20%-kal az energiafogyasztást a hagyományos megoldásokhoz képest.
Nvidia Developer
Egyetlen milliszekundum alatt azonosítja az arcokat a Nvidia legújabb chipe — a technológiát Ben Keller mérnök mutatta be februárban San Franciscóban.
IEEE Spectrum AI
A VLLM jelenlegi verzióiban a FP4 nem használható ki megfelelően a NVIDIA DGX Spark hardverén, ami jelentős teljesítménycsökkenést eredményez.
Reddit LocalLLaMA
A bizalmas AI-gyárakban használt modellek többsége jelenleg nyílt forráskódú, a Nvidia megoldása azonban lehetővé teszi a szabadon választható, zárt forráskódú modellek használatát is.
Nvidia Developer
A Lumotive 10 000 portos kapacitást célzó fejlesztésével az iparág szabványos 256 portos kapacitását sokszorosára növelheti.
IEEE Spectrum AI
A Tenstorrent QuietBox 2 ára 9 999 dollár lesz, és a második negyedévben jelenik meg a piacon.
IEEE Spectrum AI
A Huawei 812 ezer chipet szállított 2025-ben, ezzel a legnagyobb részesedést megszerzve a kínai piacon
The Decoder
Az adatközpont várhatóan 2026 második negyedévében nyitja meg kapuit, és 13 800 Nvidia chipet fog tartalmazni.
Mistral AI
A Raspberry Pi 5 16GB ára egy év alatt 120 dollárról 305 dollárra emelkedett
ZDNet AI
A kínai kormány 15. Ötéves Tervében az AI-chipek és szoftverek fejlesztésének elősegítése érdekében az ország infrastruktúrájának fejlesztését is célba vette, beleértve a számítási kapacitások, az ada
AI News
A Google Gemma 4 család legújabb modelljei akár 2,7-szer gyorsabb inferenciát tesznek lehetővé az RTX 5090-en, mint az M3 Ultra asztali gép.
MarkTechPost
Az Nvidia 2,7-szörös teljesítménynövekedést ért el a DeepSeek-R1 modellben szoftveroptimalizációkkal, a hardver változatlanul hagyása mellett.
The Decoder
Több mint 2.1 ezer csillagot gyűjtött össze a Lemonade projekt a GitHubon, ahol a fejlesztők és a felhasználók együttműködnek a további fejlesztésen.
Hacker News
Elon Musk Terafab nevű chipgyára az első dedikált AI chip-üzem lenne, amely a Tesla és xAI igényeit látná el — az elemzők szerint ez drasztikusan csökkenthetné az AI infrastruktúra külső függőségét.
AI Breakfast
A második generációs szemüvegek emellett olyan funkciókkal is rendelkeznek, mint a táplálkozás nyomon követése, WhatsApp-összefoglalók és Neural Handwriting.
Product Hunt
A tesztelt modellek teljesítményét Nick Lothian SQL benchmarkjával mérték fel.
Reddit LocalLLaMA
A Qwen3.5 modell 397 milliárd paramétert tartalmaz, amihez a 16 darab AMD MI50 GPU biztosítja a számítási kapacitást.
Reddit LocalLLaMA
A Nemotron 3 Super modell a text generation, komplex reasonálás, összegzés és kódgenerálás feladatokra optimalizált.
AWS Blog
A kínai verzió ára 1200 dollár körül van, ami érdekes lehet a jelenlegi GPU-árváltozások közepette
Reddit LocalLLaMA
Egy Reddit-felhasználó kéri a segítséget két NVIDIA 3090 gpu egy házban történő elhelyezéséhez
Reddit LocalLLaMA
A fejlemény egybeesik az OpenClaw népszerűségével, amely 300 ezer csillagot ért el a GitHubon.
Ars Technica
Nvidia a 16GB VRAM-os kártyák gyártásának csökkentését tervezi, ami érinti az RTX 5060 elérhetőségét
Reddit LocalLLaMA
A Nvidia partnere, a Kingston 32 GB DDR5-6000 memóriamodult kínálja a legolcsóbb konfigurációban.
Reddit LocalLLaMA
Több mint 40 ezer exabájt adatot termel évente a LHC, amit csak miniatűr AI modellekkel lehet valós időben feldolgozni.
Hacker News
A Glia platformja akár 80%-kal csökkentheti az emberi beavatkozást az ügyfélkapcsolatokban
AI News
Mark Warner szenátor szerint az adatközpontok adóztatásából származó bevételt munkások átmeneti támogatására lehetne felhasználni, miután az USA-ban 35%-kal csökkentek a kezdő szintű munkahelyek
TechCrunch
A Harknál 45 mérnök és tervező dolgozik az új AI interfészén, köztük korábbi Meta AI kutatók és Apple, valamint Tesla tervezők.
TechCrunch
Több mint 230 progresszív csoport támogatja a tervezetet, amelyhez hasonló szabályozást már több mint egy tucat állam is bevezetett.
Wired
Rene Haas, az Arm CEO-ja szerint a chip magas teljesítményt és energiahatékonyságot nyújt az AI-infrastruktúrában
The Decoder
Simon Willison idézi Christopher Mims-et, a The Wall Street Journal technológiai rovatvezetőjét
Simon Willison
Satya Nadella, a Microsoft CEO-ja szerint 2027-2028-ra számít egy számítási kapacitás túlkínálatra
The Decoder
A Gimlet Labs 3-10-ször gyorsítja az AI inferenciát, a cégnek már 8 számjegyű bevételt sikerült elérnie
TechCrunch
Az Arm saját AI-chipjét a Meta és az OpenAI is megvásárolja, a cég az energiahatékonyság mellett a 100 milliárd dolláros piaci részesedést is célba vette 2030-ra
Wired
A Cupertino-i óriás egy teljesen házon belüli, TSMC 3nm-es AI-gyorsítót épít, amely 2027-re kiválthatja az NVIDIA H100-as chipjeit az Apple saját adatközpontjaiban.
Bloomberg
Guilherme Rambo szerint a MacBook Neo szoftveres kamerajelzője a chip biztonságos exklávéjában fut, és még kernel-szintű exploit sem tudja a fény nélkül bekapcsolni a kamerát.
Simon Willison
Tetszik az oldal? Támogasd a fejlesztést
Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.