A kutatók szerint az APEX-EM keretrendszer segíthet az autonóm ügynökök tanulásának felgyorsításában, akár 3 kulcsfontosságú innovációval
ArXiv NLP
1204 cikk összesen
A kutatók szerint az APEX-EM keretrendszer segíthet az autonóm ügynökök tanulásának felgyorsításában, akár 3 kulcsfontosságú innovációval
ArXiv NLP
A TurboQuant technológiának köszönhetően a KV cache mérete akár 4,6-szor csökkenhet anélkül, hogy az pontosság romlana.
Reddit LocalLLaMA
A DeepL jelentése szerint a vállalatok 50%-kal több tartalmat állítanak elő, mint 2023-ban, mégis 68%-uk régi munkafolyamatokat használ.
AI News
A Qwen3.5 modell 397 milliárd paramétert tartalmaz, amihez a 16 darab AMD MI50 GPU biztosítja a számítási kapacitást.
Reddit LocalLLaMA
Bastian Rieck kutató egy új indexet vezetett be, amely mértéket ad arra, mennyire túloznak az AI marketing anyagok.
Hacker News
NickyP, a LessWrong AI szerző szerint az emberiségnek mindössze 1-4 éve maradt, mielőtt az AI radikálisan átalakítja a világot.
LessWrong AI
A Bonsai-8B modell 136 tokent dolgoz fel másodpercenként egy M4 Pro Macen
Reddit LocalLLaMA
A modell 94–96%-os pontossággal azonosítja az ismert fajokat, de ismeretlen gombáknál tévesen osztályoz — ami mérgezési kockázatot jelent.
Reddit ML
Az Anthropic belső csapata hibás csomagolás miatt tette nyilvánossá a Claude Code-forrás egy részét — az érintett fájlokat azonnal eltávolították, és új ellenőrzési lépéseket vezettek be.
Anthropic
Az Aider nyílt forráskódú AI-kódoló eszköz belső kódbázisa vált elérhetővé a GitHubon — a memóriakezelési és feladatkezelési logikát is tartalmazó repo az első napján 1100-nál is több csillagot szerzett.
Reddit LocalLLaMA
A simple10/agents-observe projekt SQLite-alapú backend és React dashboard segítségével mutatja meg, melyik alügynök melyik eszközt hívta — a telepítés egyetlen Docker-parancs.
Hacker News
Lorca McLaren és munkatársai hat modellt teszteltek, és megállapították, hogy a folyamat választások kölcsönhatásai meghatározzák az eredményeket.
ArXiv NLP
A GTC konferencián általánosan elérhetővé vált az Azure Foundry Agent Service — az első valós ügyfél a Corvus Energy, amely a platformmal cseréli ki a manuális flottaellenőrzéseket.
Azure Blog
A 27 milliárd dolláros Hyperion adatközpont éves CO₂-kibocsátása 50%-kal haladja meg a Meta 2024-es teljes karbonlábnyomát — a cég tíz új földgázerőművet finanszíroz.
TechCrunch
Karin Keller-Sutter szövetségi tanácsos szerint a Grok bot által generált szöveg nyílt nőgyűlöletet tartalmazott — a svájci jog szerint az elkövető akár 3 év börtönnel is szembesülhet.
Ars Technica
Kathleen Kennedy, a Jurassic Park és Star Wars franchise producere, az American Film Institute-nak feltett egy kérdést: „Hogyan fogjátok tanítani az ízlést?”
Wired
A kódlekés komoly piaci hátrányt jelenthet az Anthropic számára, hiszen a vállalat 380 milliárd dolláros értékeléssel készül az IPO-ra.
The Decoder
A Claude Opus 4.5 modell érte el a legjobb eredményt a FormalProofBench teszten
ArXiv AI
A Google Deepmind tanulmány szerint a hat csapda 58-90 százalékos eséllyel tudja átvenni az irányítást az autonóm AI ügynökök felett.
The Decoder
13,800 Nvidia chipet vásárol a cég
Mistral AI
A kutatók szerint a modell teljesítménye az érzelem típusától és a kulturális kontextustól függ.
ArXiv NLP
A Perplexity AI ellen egy újabb pert indítottak, mert feltételezik, hogy a cég titokban követi a felhasználók adatait.
Perplexity
Több mint 240 átfogó felhőszolgáltatást kínál az AWS
AWS Blog
Moulik Gupta kutató szerint a kisebb modellek több időt fordíthatnak a gondolkodásra, így felülmúlhatják a nagyobbak teljesítményét
Towards Data Science
A Gradient Labs 10-szoros revenue növekedést ért el, 98%-os ügyfél-elégedettséget az AI ügynök tapasztalatával
OpenAI
A Lightsailen futó OpenClaw példány alapértelmezett AI modell szolgáltatója az Amazon Bedrock
AWS Blog
A DeepMind Safety Research csapata kidolgozott egy keretrendszert, amely segít előrejelezni, hogy az RL-képzés mikor rontja a Chain-of-Thought monitorozhatóságát.
LessWrong AI
A Baton alkalmazásban több mint 10 különböző AI-ügynököt támogatnak
Hacker News
Több mint 25 ezer felhasználó integrálta a KiloClaw platformot az elmúlt hónapban, és most a KiloClaw for Organizations megjelenésével a vállalatok is csatlakozhatnak.
VentureBeat
Ahmed Nagdy fejlesztette a Claude Code interaktív tanulási rendszerét
Hacker News
A kutatók 516 egyedi bizonyítási állapottal kísérleteztek
ArXiv AI
A LIMBO csapata 5,6 millió dollárból képzett egy versenyképes modellt, és fontos eredményeket ért el a ritka események becslésében
LessWrong AI
Több mint 10 ezer hangmintát tartalmaz a rendszer
ElevenLabs
Matthew Gault elemzi Irán AI-propaganda stratégiáját
404 Media
Több mint 300 szót tartalmaz a BLOCKADE program scriptje, amelyek alapján értékelődik a könyvek tartalma
404 Media
A Search Live globális elérhetősége mellett a Gemini márciusi frissítése 5 új eszközt is bevezetett, köztük a Google Maps új, beszélgetésalapú felületét.
Google AI Blog
Az EU AI törvényének augusztusban életbe lépő átláthatósági követelményeit a szakértők szerint a generatív AI rendszerek 90%-a nem tudja teljesíteni
ArXiv AI
Több mint 50 ezer fejlesztőnek nyújt új lehetőségeket az Anthropic platformon
Anthropic
Több kutatás is azt találta, hogy az LLM-ek által generált magyarázatok nem pontosak, és a szakértők szerint ez komoly probléma az AI-felelősség szempontjából.
AI for Newsroom
A Voxtral TTS modell 2,5-ször gyorsabban dolgozik, mint az ElevenLabs
Mistral AI
Több fejlesztőnél a tervezettnél gyorsabban merülnek ki a kvóták
Anthropic
Elyse Betters Picaro, a ZDNET szerzője 10 feladatot adott mind a ChatGPT-nek, mind a Claude-nak, hogy összehasonlítsa a kettő teljesítményét.
ZDNet AI
A teljesítményteszt 2500 hosszú interakciós sorozatot tartalmaz, amelyet a WildChat platformról gyűjtöttek
ArXiv NLP
A Mistral AI szerint a testreszabás logikájának leválasztása az alapmodellről biztosítja, hogy a vállalatok "digitális idegrendszere" rugalmas maradjon.
Mistral AI
Több mint 50 ezer bot érhető el a Discordon, a LocalLlama most csatlakozott hozzájuk.
Reddit LocalLLaMA
A Reco csapat 7 óra alatt építette fel az új Go implementációt, 400 dollár token költséggel
Simon Willison
Több mint 50 előadó és 223 résztvevő gyűlt össze az INMA Media Subscriptions Summiton, ahol a régi csatornák helyett a rendszerekre való átállás volt a fő téma.
AI for Newsroom
A Nemotron 3 Super modell a text generation, komplex reasonálás, összegzés és kódgenerálás feladatokra optimalizált.
AWS Blog
Joseph Cox, a többszörösen díjnyertes újságíró fedezte fel a WebinarTV titkát.
404 Media
A kutatók szerint az LLM újraparaméterezése akár 10%-kal is javíthatja a teljesítményt, ha a modellhez nagy mennyiségű, minőségi adatot biztosítanak.
Reddit ML
Tetszik az oldal? Támogasd a fejlesztést
Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.