A Mistral AI szerint a testreszabás logikájának leválasztása az alapmodellről biztosítja, hogy a vállalatok "digitális idegrendszere" rugalmas maradjon.
Mistral AI
1211 cikk összesen
A Mistral AI szerint a testreszabás logikájának leválasztása az alapmodellről biztosítja, hogy a vállalatok "digitális idegrendszere" rugalmas maradjon.
Mistral AI
Több mint 50 ezer bot érhető el a Discordon, a LocalLlama most csatlakozott hozzájuk.
Reddit LocalLLaMA
A Reco csapat 7 óra alatt építette fel az új Go implementációt, 400 dollár token költséggel
Simon Willison
Több mint 50 előadó és 223 résztvevő gyűlt össze az INMA Media Subscriptions Summiton, ahol a régi csatornák helyett a rendszerekre való átállás volt a fő téma.
AI for Newsroom
A Nemotron 3 Super modell a text generation, komplex reasonálás, összegzés és kódgenerálás feladatokra optimalizált.
AWS Blog
Joseph Cox, a többszörösen díjnyertes újságíró fedezte fel a WebinarTV titkát.
404 Media
A kutatók szerint az LLM újraparaméterezése akár 10%-kal is javíthatja a teljesítményt, ha a modellhez nagy mennyiségű, minőségi adatot biztosítanak.
Reddit ML
A kínai verzió ára 1200 dollár körül van, ami érdekes lehet a jelenlegi GPU-árváltozások közepette
Reddit LocalLLaMA
A TurboQuant.net elemzés szerint a kompresszióhatárok eléréséhez közelednek, és az új fejlesztések valószínűleg más irányból érkeznek.
Reddit LocalLLaMA
Több mint 100 kutatómunka elemzése során azonosították a bizonytalanság fontos szerepét az UAXAI-ban
ArXiv AI
Mintegy 100 millió dollárt fektet be a Hershey az ellátási láncának digitalizálásába, amelyhez az AI-technológiát is felhasználja.
AI News
Több mint 148 szakértő támogatja a Mixture of Experts (MoEs) módszert, amely forradalmasítja a nyelvi modellek fejlesztését.
Hugging Face
Pénteken dől el, hogy az Anthropic elveszti-e a 200 millió dolláros szerződést, miután a cég elnöke, Dario Amodei, ragaszkodik a két alapelve mellett.
Ben's Bites
Taalas, egy 2,5 éves hardverstartup, egy olyan chipet fejlesztett, amely 17 ezer token/másodperc sebességet ér el.
Ben's Bites
A PentaNet projekt mögött álló csapat 124M paramétert használ az új modellben.
Reddit ML
Chris Moran, a The Guardian innovációs vezetője elmondta, hogy a Storylines fejlesztése során 20 senior szerkesztő értékelte a modell kimenetét.
AI for Newsroom
Több mint 900 millió heti aktív ChatGPT felhasználóval és 2 milliárd dolláros havi bevétele van az OpenAI-nak
The Decoder
A GPT-5.4 modell az Azure Blog szerint 2,50 dollárba kerül millió input tokenenként, a nagyobb kontextusú változat pedig 5 dollárba.
Azure Blog
OpenAI 730 milliárd dolláros értékelés mellett 110 milliárd dollárt emelt kapott
Ben's Bites
Darla Cameron, a Texas Tribune vezető termékszakértője szerint az AI-mérnöki pozíciókra beérkező pályázatok döntő többsége nem megfelelő minőségű.
AI for Newsroom
Több mint 1000 felhasználó már kipróbálta a Gemma 4 modellt a Chatbot Arena platformon.
Reddit LocalLLaMA
A LocalLLaMA közösség szerint a Linuxon futó inference akár 30%-kal gyorsabb lehet, mint a Windows alatt.
Reddit LocalLLaMA
Alexey Terekhov, médiaszakértő szerint az AI-asszisztensek valódi hatékonyságát a kontextus tudatos megtervezése határozza meg.
AI for Newsroom
Egy friss kutatás feltárta, hogy az AGENTS.md fájlban szereplő részletes tech stack és kulcsfájlok nemcsak a költségek növekedését okozzák, hanem számos további kihívást is jelentenek a fejlesztők szá
Ben's Bites
Több mint 50 ezer szerkesztő szavazott a döntésről, Emanuel Maiberg szerint.
404 Media
A TRL v1.0 kiadásával a Hugging Face lényegében átrendezi a post-tréning folyamatot, és egységesített API-t biztosít az SFT, jutalommodell, DPO és GRPO munkafolyamataihoz.
MarkTechPost
A Microsoft ezzel a lépéssel többek között az Anthropic Claude és az OpenAI GPT modelleket is együtt fogja használni a Copilot fejlesztésében.
Mistral AI
Gina Chua újságíró-stratéga két napot töltött Claude-dal szerkesztői folyamat tesztelésére — és nyíltan szólt arról, amit talált: az LLM-ek nem értenek semmit, csak analógiák alapján utánoznak.
AI for Newsroom
A Meta új AI csapata ebben a hónapban belsőleg átadta első kulcsmodelljeit, amelyek a dolgozók mindennapi munkáját fogják segíteni az „AI for Work" program keretében.
Meta AI
A ccunpacked.dev oldal részletesen feltárta a Claude Code belső architektúráját: az alkalmazás egy 11 lépéses agent loopon alapul, amelybe a felhasználói bemenet feldolgozásától az API-válaszig minden lépés beágyazódik.
Hacker News
Egy Reddit-felhasználó kéri a segítséget két NVIDIA 3090 gpu egy házban történő elhelyezéséhez
Reddit LocalLLaMA
Az Anthropic megállapodott az ausztrál kormánnyal: adatközpontot épít megújuló energiával, és 3 millió dollárt szán helyi orvosi kutatásra — Dario Amodei személyesen tárgyal a miniszterelnökkel.
Anthropic
A Liquid AI csapata 28 billió tokenből tanította be az LFM2.5-350M modellt, amely 40.4 ezer kimeneti token másodpercenkénti feldolgozására képes egyetlen NVIDIA H100 GPU-val.
MarkTechPost
Több felhasználó is jelentette, hogy a Gemini használata miatt felfüggesztették vagy korlátozták a Google-fiókjukat.
Hacker News
Több mint 10 ezer ember reagált negatívan Aravind Srinivas nyilatkozatára
Perplexity
A Google TurboQuant módszere csak egydimenziós vektorokon forgatja a súlyokat — a 2D súlymátrixokon ez nem működik, ezért a kvantáláshoz más megközelítés kell.
Reddit LocalLLaMA
Az AI-keresés éves szinten 187%-ot nő, de a kattintás és a konverzió még mindig a hagyományos keresésnél marad — ahol a high-intent forgalom összpontosul.
AI for Newsroom
Hat modellt teszteltek, és mindegyiknél ugyanazt találták: a felületi jelek 8–38-szor erősebben befolyásolják a döntést, mint maga a feladat célja.
ArXiv NLP
A Replit és Windsurf mellett a Cursor 90%-os pontszámot ért el az AIMultiple tesztjében
Cursor
A ProPublica Guild 92%-os többséggel szavazott a sztrájk mellett, amely a múlt századi jogviszonyok védelmét és az AI okozta elbocsátások elleni garanciát célozza.
AI for Newsroom
Kuangshi Ai és 15 társunk 12 szakértővel együttműködve hozta létre a SciVisAgentBench tesztet
ArXiv AI
Ha az AI modellek nem versenyeznek, hanem együttműködnek, szélesebb megoldásteret fedeznek fel — és kisebb eséllyel ragadnak le a korai, téves konszenzusnál.
ArXiv AI
S.O. Lidarity és munkatársai szerint a szemi-autonóm AI-ügynökökben spontán szocializáció figyelhető meg.
ArXiv AI
Az ügyben a bíró március 9-i döntése szerint a Perplexity Comet ügynökét emberi böngészőnek álcázták, hogy kijátszhassák a botdetekciós rendszereket.
Perplexity
Stephanie Jarmak, a Sourcegraph munkatársa 370 szoftverfejlesztési feladatot tartalmazó adathalmazzal ruházta fel a CodeScaleBench-et
Sourcegraph
Az Atlassian 26%-os javulást ért el a Recall@60 értékben, miután finomhangolta a modellt a JIRA adathalmazon.
Hugging Face
A Hugging Face új Storage Buckets funkcionalitásának köszönhetően a felhasználók már 2 perc alatt létrehozhatnak egy új bucketet az hf CLI segítségével.
Hugging Face
Több mint 30 százaléka a Fortune 500-nak már most is használja a Hugging Face nyílt forráskódú modelljeit.
Hugging Face
A Meta új technikáját a Claude Opus-4.5 és Sonnet-4.5 modellek tesztelték, amelyek 93%-os pontosságot értek el a kódellenőrzési feladatokban.
VentureBeat
A Cohere az elmúlt évben 50%-kal növelte ügyfeleinek számát
Cohere
Tetszik az oldal? Támogasd a fejlesztést
Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.