ÉlőUtoljára: 29 perceMa: 11

Rovat · 13. oldal

Modellek & LLM

GPT, Claude, Gemini és más generatív AI modellek, agents, multimodális rendszerek

355 cikk az archívumban

A Gemini 3.1 Pro 10-szor gyorsabban teljesít, mint az elődje
Modellek & LLM

A Gemini 3.1 Pro 10-szor gyorsabban teljesít, mint az elődje

Taalas, egy 2,5 éves hardverstartup, egy olyan chipet fejlesztett, amely 17 ezer token/másodperc sebességet ér el.

Ben's Bites·AI
A Microsoft Foundry bemutatja a GPT-5.4 modellt: megbízhatóbb AI a termeléshez
Modellek & LLM

A Microsoft Foundry bemutatja a GPT-5.4 modellt: megbízhatóbb AI a termeléshez

A GPT-5.4 modell az Azure Blog szerint 2,50 dollárba kerül millió input tokenenként, a nagyobb kontextusú változat pedig 5 dollárba.

Azure Blog·AI
A Google Gemma 4 modellje hamarosan megjelenhet
Modellek & LLM

A Google Gemma 4 modellje hamarosan megjelenhet

Több mint 1000 felhasználó már kipróbálta a Gemma 4 modellt a Chatbot Arena platformon.

Reddit LocalLLaMA·AI
A Meta csendben átadta első belső AI modelljeit — Bosworth személyesen vezeti a projektet
Modellek & LLM

A Meta csendben átadta első belső AI modelljeit — Bosworth személyesen vezeti a projektet

A Meta új AI csapata ebben a hónapban belsőleg átadta első kulcsmodelljeit, amelyek a dolgozók mindennapi munkáját fogják segíteni az „AI for Work" program keretében.

Meta AI·AI
A Liquid AI LFM2.5-350M modellje 28 billió tokenből tanult
Modellek & LLM

A Liquid AI LFM2.5-350M modellje 28 billió tokenből tanult

A Liquid AI csapata 28 billió tokenből tanította be az LFM2.5-350M modellt, amely 40.4 ezer kimeneti token másodpercenkénti feldolgozására képes egyetlen NVIDIA H100 GPU-val.

MarkTechPost·AI
Meta nyílt forráskódú agyi AI-t mutatott be
Modellek & LLM

Meta nyílt forráskódú agyi AI-t mutatott be

A Meta mellett a Google is új, gyorsabb hangalapú AI-t vezetett be, a Gemini 3.1 Flash Live modellt.

AI Breakfast·AI
Az IBM Granite 4.0 3B Vision modell forradalmasítja a vállalati dokumentumok feldolgozását
Modellek & LLM

Az IBM Granite 4.0 3B Vision modell forradalmasítja a vállalati dokumentumok feldolgozását

A Granite 4.0 3B Vision modell 86.4%-os Chart2Summary pontszámmal vezeti a mezőnyt a ChartNet teljesítményteszten.

Hugging Face·AI
A Black Forest Labs kiadta a Flux.2 AI modellt, de egyelőre nincs nyílt forráskódú képgenerálás
Modellek & LLM

A Black Forest Labs kiadta a Flux.2 AI modellt, de egyelőre nincs nyílt forráskódú képgenerálás

A Flux.2 modell fejlesztésében a Black Forest Labs több mint 100 embert foglalkoztatott

Midjourney·AI
A Microsoft összefogatta a GPT-t és a Claude-ot: az egyik ír, a másik ellenőriz
Modellek & LLM

A Microsoft összefogatta a GPT-t és a Claude-ot: az egyik ír, a másik ellenőriz

A Microsoft 365 Copilot új Critique funkciójában az OpenAI GPT generálja a válaszokat, az Anthropic Claude pedig felülvizsgálja azokat — 13,8%-kal pontosabb eredményeket hozva.

The New Stack·AI
Az OpenAI kiadta a GPT-5.4 xhigh modellt, ami 1M tokenes kontextusablakot kínál
Modellek & LLM

Az OpenAI kiadta a GPT-5.4 xhigh modellt, ami 1M tokenes kontextusablakot kínál

A GPT-5.4 xhigh modell 2,5 dollárba kerül millió tokenenként, ami 1,75 dollárral drágább, mint a GPT-5.2

Ben's Bites·AI
A Voxtral TTS hiányzó darabja: codec encoder súlyok a hangklónozáshoz
Modellek & LLM

A Voxtral TTS hiányzó darabja: codec encoder súlyok a hangklónozáshoz

Mistral Forge platformjának bejelentése után a Voxtral TTS hiányzó részének pótlása lehetővé teszi a hangklónozást, az új megoldásban a codec encoder súlyok kulcsszerepet játszanak.

Reddit LocalLLaMA·AI
A Google bemutatja a Gemini 3.1 Flash-Lite-ot: gyorsabb és olcsóbb, mint a 2.5 Flash
Modellek & LLM

A Google bemutatja a Gemini 3.1 Flash-Lite-ot: gyorsabb és olcsóbb, mint a 2.5 Flash

A Gemini 3.1 Flash-Lite ára 0,25 dollár 1 millió bemeneti tokenenként és 1,50 dollár 1 millió kimeneti tokenenként, ami 2,5-ször gyorsabban ad választ, mint a 2.5 Flash modell.

Google DeepMind·AI
A Qwen 3.5 9B modell 16-ról 8 bitesre váltva szinte semmit nem veszít az pontosságából
Modellek & LLM

A Qwen 3.5 9B modell 16-ról 8 bitesre váltva szinte semmit nem veszít az pontosságából

A Sam Rose által végzett kísérletek szerint a Qwen 3.5 9B modell 16-ről 4 bitesre váltásánál már érezhető minőségromlás tapasztalható, de ez még mindig 90%-os pontosságot jelent.

Simon Willison·AI
A Qwen3.5 122B modell 16 GB memóriát használ teljes kontextusban
Modellek & LLM

A Qwen3.5 122B modell 16 GB memóriát használ teljes kontextusban

A Reddit-felhasználó, Exact-Cupcake-2603 szerint a Qwen3.5 122B modell futtatása Turbo3 processzorral és 4 db mi50 videokártyával lehetséges.

Reddit LocalLLaMA·AI
A Kimi K2.6 modell két héten belül érkezik, a K3 már fejlesztés alatt áll
Modellek & LLM

A Kimi K2.6 modell két héten belül érkezik, a K3 már fejlesztés alatt áll

A Moonshot AI két héten belül kiadja a K2.6 modellt, és már a K3-as generáción is dolgozik — a K2.5 egyelőre aszinkron módban érhető el.

Reddit LocalLLaMA·AI
A GPT-5.4-mini 22 százalékpontot veszített a GPT-5-mini-hez képest
Modellek & LLM

A GPT-5.4-mini 22 százalékpontot veszített a GPT-5-mini-hez képest

A GPT-5.4-mini modell a benchmarkokban 22 százalékponttal marad el elődjétől — a közösség szerint az OpenAI a költséghatékonyság oltárán áldozta fel a teljesítményt.

Reddit ML·AI
A BeSafe-Bench megmutatja, milyen biztonsági kockázatokat rejtnek a mesterséges intelligens ügynökök
Modellek & LLM

A BeSafe-Bench megmutatja, milyen biztonsági kockázatokat rejtnek a mesterséges intelligens ügynökök

A kutatók szerint a 13 legnépszerűbb ügynök közül egy sem képes 40%-nál több feladatot biztonságosan elvégezni.

ArXiv AI·AI
A Bluesky új AI-alkalmazása, az Attie testreszabott hírfolyamokat kínál
Modellek & LLM

A Bluesky új AI-alkalmazása, az Attie testreszabott hírfolyamokat kínál

Jay Graber, a Bluesky korábbi CEO-ja és jelenlegi innovációs tisztje, néhány hónappal ezelőtt kezdte el fejleszteni az Attie alkalmazást

TechCrunch·AI
Megjelent a Mr. Chatterbox, a 28 ezer victoria-kori könyvből tanult nyelvi modell
Modellek & LLM

Megjelent a Mr. Chatterbox, a 28 ezer victoria-kori könyvből tanult nyelvi modell

Trip Venturella fejlesztette ki a modellt, amely 2,05 GB méretű és 340 millió paramétert tartalmaz.

Simon Willison·AI
Az OpenAI 50 ázsiai katasztrófa-elhárítási vezetőt képez az AI használatára
Modellek & LLM

Az OpenAI 50 ázsiai katasztrófa-elhárítási vezetőt képez az AI használatára

Több mint 11 milliárd dollár kárt okoztak a természeti katasztrófák az ASEAN országokban az elmúlt években.

OpenAI·AI
50 kutatás bizonyítja: a nyelvi kompetencia és a kulturális érzékenység elválik
Modellek & LLM

50 kutatás bizonyítja: a nyelvi kompetencia és a kulturális érzékenység elválik

Sina Bagheri Nezhad szerint a nyelvi kompetencia és a kulturális érzékenység elválasztása az NLP egyik legnagyobb kihívása

ArXiv NLP·AI

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom