
Microsoft 3 új AI modellt indít, leveri az OpenAI-t és a Google-t
A Microsoft modelljeihez kevesebb mint 10 fős csapatok dolgoztak, akik az iparág legjobb eredményeit érték el.
GPT, Claude, Gemini és más generatív AI modellek, agents, multimodális rendszerek

A Microsoft modelljeihez kevesebb mint 10 fős csapatok dolgoztak, akik az iparág legjobb eredményeit érték el.

A kínai Z.ai bemutatta a GLM-5V-Turbo modellt: 200 000 tokenes kontextusablak, megerősítéses tanulással fejlesztve, STEM-oktatástól videóanalízisig 30 feladattípust kezel.
A kutatók 50 TruthfulQA tesztesetet használtak — a Claude Sonnet 4 behódolási aránya mindössze 2%-ra esett a Silicon Mirror alkalmazásával.

A kutatók 25 ezer feladatot tartalmazó kísérletet végeztek, amelyben 8 modellt és 4-256 ügynököt használtak, és megfigyelték, hogy az ön szerveződő LLM-ügynökök már jelenleg is képesek specializált sz

A Meta Superintelligence Laborjának új AI modellei fejlesztésében olyan szakemberek vettek részt, mint Alexandr Wang, a Scale AI alapítója.

A kutatók egy natív harmony agent harness-t is kifejlesztettek, amely lehetővé teszi a modell natív formátumának használatát.

Az LLM-ek figyelmi ablakának növekedése együtt jár a humán fenntartott figyelem képességének csökkenésével, amely 2004 és 2026 között mintegy 16 000-ről 1800 tokentre csökkent.

A PolarQuant a Qwen3.5-9B perplexity értékét 6.90-ről 6.40-re csökkenti

Az Anthropic eddigi legerősebb, kiadatlan Claude Mythos modelljéről szivárogtak ki dokumentumok — ezek szerint a modell már betanítva és tesztelve van, és jelentős előrelépést hoz logikai gondolkodásban, kódírásban és a biztonsági területen is.

Az OpenAI 10 milliárd dollár további befektetést szerzett, amely a rekordbefektetési körét 120 milliárd dollár fölé emeli.

A Google Gemini modelljének bevezetése egybeesik az Axiom AI reasoning startup 200M dolláros befektetési körével, amely 1,6 milliárd dolláros értékelést eredményezett.

A Bonsai 1-Bit modell átlagos hibarányának logaritmusát a modell méretével összehasonlítva mérhetjük, amit az úgynevezett intelligencia-sűrűség mutat.

A kutatók szerint a Gemini 3 modellhez hasonló viselkedést más fejlett modellekben is megfigyeltek, köztük az OpenAI GPT-5.2 és az Anthropic Claude Haiku 4.5 modelljeiben.

A PrismML által kifejlesztett Bonsai 1-bit modelljei akár 8B paraméterig is elérhetők a GitHubon

A TurboQuant-nak köszönhetően a prompt feldolgozás 14%-kal gyorsabb lett.

A kutatók szerint a végpontokon orientált klaszterezési módszerrel kapcsolatos kutatásokban a spectral clustering és a k-means algoritmusok együttműködése javíthatja a klaszterezési eredményeket.

Az új TurboQuant modell a Qwen3.5-27B architektúrát használja, ami közel áll a Q4_0 minőséghez.

A TurboQuant technológiának köszönhetően a KV cache mérete akár 4,6-szor csökkenhet anélkül, hogy az pontosság romlana.

A Bonsai-8B modell 136 tokent dolgoz fel másodpercenként egy M4 Pro Macen

Moulik Gupta kutató szerint a kisebb modellek több időt fordíthatnak a gondolkodásra, így felülmúlhatják a nagyobbak teljesítményét

Több mint 148 szakértő támogatja a Mixture of Experts (MoEs) módszert, amely forradalmasítja a nyelvi modellek fejlesztését.
Tetszik az oldal? Támogasd a fejlesztést
Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.