ÉlőUtoljára: 3 perceMa: 16

Rovat · 11. oldal

Modellek & LLM

GPT, Claude, Gemini és más generatív AI modellek, agents, multimodális rendszerek

355 cikk az archívumban

Az OpenAI és a Claude modelljei novemberben átléptek egy küszöböt, már majdnem mindig működnek
Modellek & LLM

Az OpenAI és a Claude modelljei novemberben átléptek egy küszöböt, már majdnem mindig működnek

A Simon Willison szerint a szoftverfejlesztőknek újra kell gondolniuk a munkafolyamataikat, mivel a kódoló ügynökök képesek gyorsan és pontosan dolgozni.

Simon Willison·AI
Nagy nyelvi modellek képtelenek felmérni saját feladatuk időtartamát
Modellek & LLM

Nagy nyelvi modellek képtelenek felmérni saját feladatuk időtartamát

A kutatók szerint a nagy nyelvi modellek 4-7-szeresére becsülik túl a feladatok időtartamát, ami komoly gyakorlati következményekkel jár az ügynökszintű tervezésben és ütemezésben.

ArXiv NLP·AI
A Gemini 3 Deep Think 48,4%-os eredményt ért el a Humanity’s Last Exam teljesítményteszten
Modellek & LLM

A Gemini 3 Deep Think 48,4%-os eredményt ért el a Humanity’s Last Exam teljesítményteszten

A Gemini 3 Deep Think emellett 84,6%-os eredményt ért el az ARC-AGI-2 teljesítményteszten, és 3455 Elo pontot ért el a Codeforces versenysorozatban.

Google DeepMind·AI
A Google Gemini 3.1 Pro 77,1%-os eredményt ért el az ARC-AGI-2 teljesítményteszten
Modellek & LLM

A Google Gemini 3.1 Pro 77,1%-os eredményt ért el az ARC-AGI-2 teljesítményteszten

A Gemini 3.1 Pro modell a fogyasztók és fejlesztők számára is elérhető lesz különböző platformokon, például a Gemini API-n, Vertex AI-n, Gemini appon és NotebookLM-en.

Google DeepMind·AI
Az SPORE klaszterezési algoritmus forradalmasítja az adatfeldolgozást
Modellek & LLM

Az SPORE klaszterezési algoritmus forradalmasítja az adatfeldolgozást

A SPORE klaszterezési algoritmust az úgynevezett unsupervised learning módszerrel fejlesztették ki, ami lehetővé teszi a címkézés nélküli adatfeldolgozást.

Reddit ML·AI
A Dynin-Omni 19 multimodális tesztet teljesít
Modellek & LLM

A Dynin-Omni 19 multimodális tesztet teljesít

A Dynin-Omni modell 87.6 pontot ért el a GSM8K teljesítményteszten

ArXiv NLP·AI
A Meta Avocado modellje májusról későbbre csúszik
Modellek & LLM

A Meta Avocado modellje májusról későbbre csúszik

A Meta Avocado modelljének késlekedése miatt a cégnek át kell értékelnie a nyílt forráskódú stratégiáját.

Meta AI·AI
Az Arcee AI kiadja a Trinity Large Thinkinget, egy 400 milliárd paraméteres nyílt forráskódú modellt
Modellek & LLM

Az Arcee AI kiadja a Trinity Large Thinkinget, egy 400 milliárd paraméteres nyílt forráskódú modellt

A Trinity Large Thinking modell a PinchBench benchmarken a 2. helyen áll, csak a Claude Opus-4.6 előzi meg.

MarkTechPost·AI
A GPT modell 4 szakaszban bukik meg az aritmetikai feladatokon
Modellek & LLM

A GPT modell 4 szakaszban bukik meg az aritmetikai feladatokon

A kutatók szerint a GPT modell hibájának korrekciója a layout, a carry-semantika, a rekombinációs és a tens-resziduális szakaszokon keresztül történhet.

ArXiv NLP·AI
A Hugging Face kiadta a TRL v1.0-t, 75-nél több módszert tartalmaz
Modellek & LLM

A Hugging Face kiadta a TRL v1.0-t, 75-nél több módszert tartalmaz

A TRL v1.0 fejlesztésébe 6 évnyi munka és több mint 1000 commit ment bele

Reddit LocalLLaMA·AI
A Meta Avocado modellje 9 milliárd paramétert tartalmaz, de nem nyílt forráskódú
Modellek & LLM

A Meta Avocado modellje 9 milliárd paramétert tartalmaz, de nem nyílt forráskódú

A Meta Avocado modellje képes komplex matematikai feladatokat megoldani, amelyeket korábbi Llama modellek nem tudtak kezelni.

Meta AI·AI
A GPT-5.2 sem tud elszámolni ötülig: a megbízható LLM-ek határai
Modellek & LLM

A GPT-5.2 sem tud elszámolni ötülig: a megbízható LLM-ek határai

A kutatók szerint a megbízható LLM-ek fejlesztését akadályozza, hogy a fejlesztők nem fedik fel a modellek magas szintű architektúráját és paraméterszámát.

Hacker News·AI
A Google Gemma 4 modellje 31 milliárd paraméterrel érte el a harmadik helyet az Arena AI ranglistán
Modellek & LLM

A Google Gemma 4 modellje 31 milliárd paraméterrel érte el a harmadik helyet az Arena AI ranglistán

A Gemma 4 modell 31 milliárd paraméteres verziója mellett a Google három kisebb modellt is kiadott, beleértve a 2B és 4B paraméteres E2B és E4B modelleket is.

Simon Willison·AI
Google Gemma 4 modellje Apache 2.0 licenc alatt érkezik, könnyebben integrálható
Modellek & LLM

Google Gemma 4 modellje Apache 2.0 licenc alatt érkezik, könnyebben integrálható

A Google négy különböző modellt adott ki két kategóriában: egy 31B-paraméteres sűrű modell és egy 26B A4B Mixture-of-Experts modell a munkaállomásokra, valamint két kompakt modell, az E2B és az E4B az alacsonyabb erőforrású eszközökhöz.

VentureBeat·AI
A Google Gemma 4 modell mostantól teljesen nyílt forráskódú, és hozzáférést biztosít az erős helyi AI-hez, akár telefonon is
Modellek & LLM

A Google Gemma 4 modell mostantól teljesen nyílt forráskódú, és hozzáférést biztosít az erős helyi AI-hez, akár telefonon is

Több mint 400 millió letöltés után a Gemma modell mostantól az Apache 2.0 licenc alatt áll, ami lehetővé teszi a fejlesztők számára, hogy korlátlanul használják és terjesszék a modellt.

ZDNet AI·AI
A Gemma 4 család 2,3 milliárd paraméterrel érkezik
Modellek & LLM

A Gemma 4 család 2,3 milliárd paraméterrel érkezik

A Gemma 4 modellcsalád az Apache 2 licenc alatt nyílt forráskódú, és olyan multimodális intelligenciát kínál, amely képek, szövegek és hangok feldolgozására is képes.

Hugging Face·AI
A Gemma 4 modellcsalád: 31B paraméterrel a legjobb nyílt modell
Modellek & LLM

A Gemma 4 modellcsalád: 31B paraméterrel a legjobb nyílt modell

A Gemma 4 modellcsalád már most több mint 400 millió letöltést ért el, és több mint 100 000 változatot hozott létre a fejlesztők.

Google DeepMind·AI
A Microsoft 2,5-szer gyorsabb beszédfelismerő modellt dob piacra
Modellek & LLM

A Microsoft 2,5-szer gyorsabb beszédfelismerő modellt dob piacra

A Microsoft új modelljei olcsóbbak, mint a Google és az OpenAI modelljei, a MAI-Transcribe-1 például 0,36 dollárba kerül óránként.

TechCrunch·AI
Google bemutatja a Gemma 4 nyílt AI-modelljét, átáll az Apache 2.0 licencre
Modellek & LLM

Google bemutatja a Gemma 4 nyílt AI-modelljét, átáll az Apache 2.0 licencre

A Gemma 4 modell az Ars Technica szerint a harmadik helyen debütál az Arena listán, a GLM-5 és a Kimi 2.5 mögött, de sokkal kisebb méretű, ami olcsóbbá teszi a futtatását.

Ars Technica·AI
A PAR²-RAG 23,5 százalékkal pontosabban válaszol a kérdésekre
Modellek & LLM

A PAR²-RAG 23,5 százalékkal pontosabban válaszol a kérdésekre

A PAR²-RAG modell a négy tesztben is folyamatosan felülmúlta a korábbi legjobb eredményeket.

ArXiv AI·AI
Az OpenAI szerint a GPT modellnek van "látótere" az AGI-hez
Modellek & LLM

Az OpenAI szerint a GPT modellnek van "látótere" az AGI-hez

Több kutató, köztük Yann LeCun és Demis Hassabis, vitatja az OpenAI álláspontját, és úgy gondolják, hogy a nagy nyelvi modellek önmagukban nem elegendőek az általános intelligencia eléréséhez.

The Decoder·AI

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom