
Az OpenAI és a Claude modelljei novemberben átléptek egy küszöböt, már majdnem mindig működnek
A Simon Willison szerint a szoftverfejlesztőknek újra kell gondolniuk a munkafolyamataikat, mivel a kódoló ügynökök képesek gyorsan és pontosan dolgozni.
GPT, Claude, Gemini és más generatív AI modellek, agents, multimodális rendszerek

A Simon Willison szerint a szoftverfejlesztőknek újra kell gondolniuk a munkafolyamataikat, mivel a kódoló ügynökök képesek gyorsan és pontosan dolgozni.

A kutatók szerint a nagy nyelvi modellek 4-7-szeresére becsülik túl a feladatok időtartamát, ami komoly gyakorlati következményekkel jár az ügynökszintű tervezésben és ütemezésben.

A Gemini 3 Deep Think emellett 84,6%-os eredményt ért el az ARC-AGI-2 teljesítményteszten, és 3455 Elo pontot ért el a Codeforces versenysorozatban.

A Gemini 3.1 Pro modell a fogyasztók és fejlesztők számára is elérhető lesz különböző platformokon, például a Gemini API-n, Vertex AI-n, Gemini appon és NotebookLM-en.

A SPORE klaszterezési algoritmust az úgynevezett unsupervised learning módszerrel fejlesztették ki, ami lehetővé teszi a címkézés nélküli adatfeldolgozást.

A Dynin-Omni modell 87.6 pontot ért el a GSM8K teljesítményteszten

A Meta Avocado modelljének késlekedése miatt a cégnek át kell értékelnie a nyílt forráskódú stratégiáját.

A Trinity Large Thinking modell a PinchBench benchmarken a 2. helyen áll, csak a Claude Opus-4.6 előzi meg.

A kutatók szerint a GPT modell hibájának korrekciója a layout, a carry-semantika, a rekombinációs és a tens-resziduális szakaszokon keresztül történhet.

A TRL v1.0 fejlesztésébe 6 évnyi munka és több mint 1000 commit ment bele

A Meta Avocado modellje képes komplex matematikai feladatokat megoldani, amelyeket korábbi Llama modellek nem tudtak kezelni.

A kutatók szerint a megbízható LLM-ek fejlesztését akadályozza, hogy a fejlesztők nem fedik fel a modellek magas szintű architektúráját és paraméterszámát.

A Gemma 4 modell 31 milliárd paraméteres verziója mellett a Google három kisebb modellt is kiadott, beleértve a 2B és 4B paraméteres E2B és E4B modelleket is.

A Google négy különböző modellt adott ki két kategóriában: egy 31B-paraméteres sűrű modell és egy 26B A4B Mixture-of-Experts modell a munkaállomásokra, valamint két kompakt modell, az E2B és az E4B az alacsonyabb erőforrású eszközökhöz.

Több mint 400 millió letöltés után a Gemma modell mostantól az Apache 2.0 licenc alatt áll, ami lehetővé teszi a fejlesztők számára, hogy korlátlanul használják és terjesszék a modellt.

A Gemma 4 modellcsalád az Apache 2 licenc alatt nyílt forráskódú, és olyan multimodális intelligenciát kínál, amely képek, szövegek és hangok feldolgozására is képes.

A Gemma 4 modellcsalád már most több mint 400 millió letöltést ért el, és több mint 100 000 változatot hozott létre a fejlesztők.

A Microsoft új modelljei olcsóbbak, mint a Google és az OpenAI modelljei, a MAI-Transcribe-1 például 0,36 dollárba kerül óránként.

A Gemma 4 modell az Ars Technica szerint a harmadik helyen debütál az Arena listán, a GLM-5 és a Kimi 2.5 mögött, de sokkal kisebb méretű, ami olcsóbbá teszi a futtatását.

A PAR²-RAG modell a négy tesztben is folyamatosan felülmúlta a korábbi legjobb eredményeket.

Több kutató, köztük Yann LeCun és Demis Hassabis, vitatja az OpenAI álláspontját, és úgy gondolják, hogy a nagy nyelvi modellek önmagukban nem elegendőek az általános intelligencia eléréséhez.
Tetszik az oldal? Támogasd a fejlesztést
Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.