Rovat · 12. oldal

Modellek & LLM

GPT, Claude, Gemini és más generatív AI modellek, agents, multimodális rendszerek

578 cikk az archívumban

Folyamatosan figyel az új, nyílt forráskódú AI-modell, 0,4 másodpercenként dönt a megszólalásról

A Gemini 3 Flash-t is legyőzte zajészlelési teszteken az Audio Interaction modell. A modell 302 000 órányi adathalmazon tanult.

The Decoder·1 hónapjaAI

Modellek & LLM

Valós idejű, 40 nyelvet átírásra képes ASR-modell a NVIDIÁ-tól

Az NVIDIA új, 600 millió paraméteres ASR-modelljével egyetlen ellenőrzőpontból 40 nyelvet lehet valós időben átírni. A modell a Hugging Face-en érhető el, nyílt súlyokkal és OpenMDW-1.1 licenc alatt.

MarkTechPost·1 hónapjaAI

Modellek & LLM

Mustafa Suleyman: Az Anthropic AI-szolgáltatásai túl drágák

Az Anthropic AI-szolgáltatásai rendkívül drágák, ezért a fejlesztők olcsóbb alternatívákat keresnek. A Microsoft AI vezérigazgatója, Mustafa Suleyman hangsúlyozta, hogy a fejlesztők számára kiemelten fontos a költséghatékonyság.

Anthropic·1 hónapjaAI

Modellek & LLM

Andreas Kling: Ladybird már nem fogad külső kódot, az AI-fejlődés miatt

A Ladybird böngésző nem fogad többé nyilvános kódbeküldéseket, mert az AI-fejlődés miatt a korábbi feltételezések már nem érvényesek a felelősségvállalásra.

Simon Willison·1 hónapjaAI

Modellek & LLM

NVIDIA Nemotron 3 Ultra 550B: 1 millió token kontextus és LatentMoE architektúra

Az NVIDIA Nemotron 3 Ultra 550B modell 550 milliárd paramétert és 1 millió token kontextushosszt kínál, LatentMoE architektúrával.

Reddit LocalLLaMA·1 hónapjaAI

Modellek & LLM

Laptopok végzik el az AI-feladatok felét a Perplexity új rendszerében

A Perplexity új hibrid inference rendszere automatikusan dönti el, mely feladatokat futtatja a felhasználó gépén, és melyeket küld erősebb felhőalapú modelleknek.

Perplexity·1 hónapjaAI

Modellek & LLM

Képekből videót készít az xAI új Grok Imagine 1.5 modellje 720p felbontásban

Az xAI új Grok Imagine Video 1.5 modellje képekből képes rövid videókat generálni akár 720p felbontásban, szöveges utasításokkal vezérelve a mozgást és a hangulatot.

The Decoder·1 hónapjaAI

Modellek & LLM

Microsoft: Saját AI-modellekkel törnek a teljes önellátásra

A Microsoft hét saját fejlesztésű AI-modellt dobott piacra, hogy csökkentse függőségét az OpenAI-hoz és az Anthropic-hoz hasonló partnerektől.

Anthropic·1 hónapjaAI

Modellek & LLM

Microsoft Aion 1.0: 14 milliárdos AI-modell fut Windows 11-en

A Microsoft Aion 1.0 Plan egy 14 milliárd paraméteres, 32K kontextusú modell, amely helyben fut a Windows 11-en, és csökkenti a cég függőségét az OpenAI-tól.

Reddit LocalLLaMA·1 hónapjaAI

Modellek & LLM

Google 16GB RAM-mal futó AI-modellt ad ki, 12 milliárd paraméterrel

A Google új, 12 milliárd paraméteres Gemma 4 12B modellje 16GB RAM-mal futtatható, ami a legtöbb átlagos laptopon lehetővé teszi a futtatást.

Ars Technica·1 hónapjaAI

Modellek & LLM

DPO-módszerrel csökkentik a szöveggenerálás ismétlődési hibáit — 59%-os átlagjavulás

A Direct Preference Optimization (DPO) módszerét alkalmazva a DharmaOCR modellje 59%-kal csökkentette a szöveggenerálás során fellépő ismétlődési hibákat, a korábbi SFT-modellekhez képest.

Hugging Face·1 hónapjaAI

Modellek & LLM

Claude Opus 4.8: 4x kevesebb hibával ír kódot az Anthropic új modellje

Az Anthropic május 28-án kiadott Claude Opus 4.8 modellje 4x kevesebb hibával ír kódot, 2.5x gyorsabb és 3x olcsóbb lett, miközben megbízhatósága is nőtt.

TheSequence·1 hónapjaAI

Modellek & LLM

Új módszer gyorsítja a Diffusion LLM-ek válaszidejét — 37%-kal több adatot dolgoz fel

A Fast-dLLM++ Fréchet profil dekódolással gyorsítja a Diffusion LLM-ek válaszidejét, akár 37%-kal növelve a sebességet a LLaDA-8B modellen.

ArXiv NLP·1 hónapjaAI

Modellek & LLM

AI-feladatokat oszt szét a felhasználó gépén és a felhőben a Perplexity új rendszere

A Perplexity AI új hibrid rendszere valós időben osztja szét az AI-feladatokat a felhasználó gépe és a felhő között. A rendszer célja a mesterséges intelligenciával kapcsolatos feladatok számítási költségeinek csökkentése.

Perplexity·1 hónapjaAI

Modellek & LLM

ART-rendszer 20%-kal gyorsítja az LLM-ek válaszidejét — csökkenti a memóriaforgalmat

Az ART nevű új technika 20%-kal növeli a nagy nyelvi modellek generálási sebességét, miközben csökkenti a memóriaforgalmat.

ArXiv NLP·1 hónapjaAI

Modellek & LLM

Mistral AI: Európa legnagyobb AI laboratóriuma nem a legokosabb modellt célozza meg

A francia Mistral AI nem a tudás mennyiségét, hanem a hatékonyságot helyezi előtérbe, arra számítva, hogy a cégeknek nem lesz szükségük a legokosabb, legdrágább AI-modellekre.

Mistral AI·1 hónapjaAI

Modellek & LLM

Két nagyságrendet csökkent az AI a kínai nyelvtan-javításban — új módszerrel

Az új CSRP módszer 50.99 $F_{0.5}$-os eredménnyel új csúcsot állít fel a kínai nyelvtani hibajavításban, miközben 5.20 ponttal múlja felül a GPT-4-et a helyesírásban.

ArXiv NLP·1 hónapjaAI

Modellek & LLM

GPT-5.2 57%-kal jobb adatspecializációt hoz – önvezető AI-mérnökök dolgoznak

Az önvezető AI-mérnökök képesek végigvinni a teljes adatmérnöki folyamatot, így a GPT-5.2 által generált adatok 57,29%-kal javítják a célmodell teljesítményét.

ArXiv NLP·1 hónapjaAI

Modellek & LLM

Claude Opus 4.8 már tudja mondani: "Nem tudom"

Az Anthropic új Claude Opus 4.8 modellje képes beismerni, ha nem tud valamit, ami fontos lépés az AI átláthatósága felé.

Anthropic·1 hónapjaAI

Modellek & LLM

AI-mániában az USA: Harvard professzora szerint túlzó a lelkesedés

Az amerikai piacok szárnyalása mögött álló AI-befektetések túlzott lelkesedését kérdőjelezi meg Gita Gopinath, a Harvard közgazdász professzora.

Bloomberg Technology·1 hónapjaAI

Modellek & LLM

SalsaAgent: Emberrel és zenére táncol az új AI modell

A SalsaAgent nevű új modell képes emberi táncosokkal interakcióba lépni és zenére koreografált salsa mozdulatokat generálni. Az új multimodális modell a szociálisan érett robotok és interaktív virtuális ügynökök fejlesztését célozza.

ArXiv CV·1 hónapjaAI