Több mint 148 szakértő támogatja a Mixture of Experts (MoEs) módszert, amely forradalmasítja a nyelvi modellek fejlesztését.
Hugging Face
204 cikk összesen (szűrt)
Több mint 148 szakértő támogatja a Mixture of Experts (MoEs) módszert, amely forradalmasítja a nyelvi modellek fejlesztését.
Hugging Face
Taalas, egy 2,5 éves hardverstartup, egy olyan chipet fejlesztett, amely 17 ezer token/másodperc sebességet ér el.
Ben's Bites
A GPT-5.4 modell az Azure Blog szerint 2,50 dollárba kerül millió input tokenenként, a nagyobb kontextusú változat pedig 5 dollárba.
Azure Blog
Több mint 1000 felhasználó már kipróbálta a Gemma 4 modellt a Chatbot Arena platformon.
Reddit LocalLLaMA
A Meta új AI csapata ebben a hónapban belsőleg átadta első kulcsmodelljeit, amelyek a dolgozók mindennapi munkáját fogják segíteni az „AI for Work" program keretében.
Meta AI
A Liquid AI csapata 28 billió tokenből tanította be az LFM2.5-350M modellt, amely 40.4 ezer kimeneti token másodpercenkénti feldolgozására képes egyetlen NVIDIA H100 GPU-val.
MarkTechPost
A Meta mellett a Google is új, gyorsabb hangalapú AI-t vezetett be, a Gemini 3.1 Flash Live modellt.
AI Breakfast
A Granite 4.0 3B Vision modell 86.4%-os Chart2Summary pontszámmal vezeti a mezőnyt a ChartNet teljesítményteszten.
Hugging Face
A Flux.2 modell fejlesztésében a Black Forest Labs több mint 100 embert foglalkoztatott
Midjourney
A Microsoft 365 Copilot új Critique funkciójában az OpenAI GPT generálja a válaszokat, az Anthropic Claude pedig felülvizsgálja azokat — 13,8%-kal pontosabb eredményeket hozva.
The New Stack
A GPT-5.4 xhigh modell 2,5 dollárba kerül millió tokenenként, ami 1,75 dollárral drágább, mint a GPT-5.2
Ben's Bites
Mistral Forge platformjának bejelentése után a Voxtral TTS hiányzó részének pótlása lehetővé teszi a hangklónozást, az új megoldásban a codec encoder súlyok kulcsszerepet játszanak.
Reddit LocalLLaMA
A Gemini 3.1 Flash-Lite ára 0,25 dollár 1 millió bemeneti tokenenként és 1,50 dollár 1 millió kimeneti tokenenként, ami 2,5-ször gyorsabban ad választ, mint a 2.5 Flash modell.
Google DeepMind
A Sam Rose által végzett kísérletek szerint a Qwen 3.5 9B modell 16-ről 4 bitesre váltásánál már érezhető minőségromlás tapasztalható, de ez még mindig 90%-os pontosságot jelent.
Simon Willison
A Reddit-felhasználó, Exact-Cupcake-2603 szerint a Qwen3.5 122B modell futtatása Turbo3 processzorral és 4 db mi50 videokártyával lehetséges.
Reddit LocalLLaMA
A Moonshot AI két héten belül kiadja a K2.6 modellt, és már a K3-as generáción is dolgozik — a K2.5 egyelőre aszinkron módban érhető el.
Reddit LocalLLaMA
A GPT-5.4-mini modell a benchmarkokban 22 százalékponttal marad el elődjétől — a közösség szerint az OpenAI a költséghatékonyság oltárán áldozta fel a teljesítményt.
Reddit ML
A kutatók szerint a 13 legnépszerűbb ügynök közül egy sem képes 40%-nál több feladatot biztonságosan elvégezni.
ArXiv AI
Jay Graber, a Bluesky korábbi CEO-ja és jelenlegi innovációs tisztje, néhány hónappal ezelőtt kezdte el fejleszteni az Attie alkalmazást
TechCrunch
Trip Venturella fejlesztette ki a modellt, amely 2,05 GB méretű és 340 millió paramétert tartalmaz.
Simon Willison
Több mint 11 milliárd dollár kárt okoztak a természeti katasztrófák az ASEAN országokban az elmúlt években.
OpenAI
Sina Bagheri Nezhad szerint a nyelvi kompetencia és a kulturális érzékenység elválasztása az NLP egyik legnagyobb kihívása
ArXiv NLP
A Zig programozási nyelven írt ZINC motorral akár 10 százalékkal gyorsabban futnak a modellek, mint a konkurens megoldások.
Reddit LocalLLaMA
A tesztek szerint a M5 Max 128GB RAM-mal akár 76GB méretű modelleket is képes kezelni.
Reddit LocalLLaMA
Több mint 75 gépi tanulási projektöt mutatnak be forrásunkban, miközben a szakemberek az open source anyagok hiányosságairól szóló vitát folytatják.
Reddit ML
A Hebbian fast-weight megvalósítás mögött álló csapat a BDH architektúrára optimalizálta a megoldást.
Reddit ML
Mistral pénteken jelentette be új, nyílt forráskódú beszédszintetizáló modelljét
Reddit LocalLLaMA
A DreamHouse benchmarkhez 26 ezer struktúrát gyűjtöttek össze, amelyek 13 különböző építészeti stílust képviselnek.
ArXiv AI
A FinMCP-Bench 613 mintát tartalmaz, 10 fő forgatókönyv és 33 alforgatókönyv keretében.
ArXiv AI
A Wired tesztje során minden ötödik kérdésre hirdetés érkezett, összesen 500 kérdésből álló mintán.
Wired
Az Indagari adatai szerint a legtöbb új felhasználó az alap "Pro" csomagot választja, ami havi 20 dollárba kerül.
TechCrunch
A Transcribe modell 2 milliárd paraméterrel és 14 nyelvet támogat, köztük angolt, németet, franciát és japánt.
The Decoder
A Taylor Clemons által kedvezményként javasolt monitor 95%-os sRGB színtartománnyal rendelkezik
ZDNet AI
Több mint 5 külső szolgáltatással, például a GitHubbal és a Gmaillel integrálódik a Codex
Ars Technica
A szociológus Dr. Ruth Diaz szerint a Meta döntése "mélyen káros" és "lelki torture"-nak minősül.
404 Media
A Disney 1 milliárd dolláros befektetését vontja vissza az OpenAI-ba
404 Media
A következő 12-24 hónapban az agens kereskedelemhez igazodó szervezeteknek fejleszteniük kell adatkezelési rendszerüket.
MIT Technology Review
Több mint 1 millió termékinformációt dolgoz fel a ChatGPT új funkciója
OpenAI
Több mint 400 ezer felhasználóval és 250 alkotóval rendelkező OhChat platformon Cherie Deville és Carmen Elektra is szerepel.
Wired
A datasette-llm 0.1a1 verzióban 127 plugin használhatja az LLM modelleket
Simon Willison
Alisa Fortin termékmenedzser szerint a Lyria 3 modell két változatban érhető el, a Lyria 3 Pro háromperces dalokat hoz létre.
Google AI Blog
Alisa Fortin termékmenedzser szerint a Nano Banana 2 modell fejlettebb képszerkesztési lehetőségeket kínál
Google AI Blog
A Gemini 3.1 Flash Live modell 36.1 százalékos eredményt ért el a Scale AI Audio MultiChallenge tesztben.
Ars Technica
Matthias Bastian szerint a Gemini 3.1 Flash-Lite 360 tokent dolgoz fel másodpercenként
The Decoder
A Google szerint a TurboQuant 8-szoros teljesítménynövekedést és 6-szoros memóriahasználat-csökkenést ért el bizonyos tesztekben.
Ars Technica
A Google Gemini 3.1 Flash-Lite modell 0,25 dollárba kerül millió bemeneti tokenenként, és 1,50 dollárba millió kimeneti tokenenként.
Google AI Blog
Több mint 6 kategóriába sorolt biztonsági politika került kidolgozásra, hogy a fejlesztők hatékonyabban védelmezhessék a tinédzsereket.
OpenAI
Több mint 50%-os sikeraránnyal kell reprodukálhatónak lennie a harmadik féltől származó parancsok befecskendezésének és az adatok kiszivárogtatásának a Safety Bug Bounty programban.
OpenAI
Callum McMahon biztonsági kutató fedezte fel a támadást, ami legalább két verzióban, a 1.82.7 és 1.82.8-ban okozott károkat.
The Decoder
Több ezer felhasználó hagyta el a ChatGPT-t, miközben az Anthropic az iráni amerikai csapásokat gyorsítja fel
MIT Technology Review
Tetszik az oldal? Támogasd a fejlesztést
Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.