Rovat · 3. oldal

Modellek & LLM

GPT, Claude, Gemini és más generatív AI modellek, agents, multimodális rendszerek

578 cikk az archívumban

Cohere nyílt forráskódúvá tette legerősebb AI-modelljét, a Command A+-t

A Cohere nyílt forráskódúvá tette legújabb AI-modelljét, a Command A+-t, amely kétszer gyorsabb a korábbi verzióknál. A modell súlyai ingyenesen hozzáférhetők, és az Nvidia GPU-kon fut.

AI for Newsroom·2 heteAI

Modellek & LLM

Claude Sonnet 5 elérhető az AWS-en — gyorsabb kódolást és AI-ügynököket ígér

Az Anthropic Claude Sonnet 5 modellje már elérhető az AWS-en, kódoláshoz, AI-ügynökökhöz és professzionális munkaterhelésekhez kínál fejlett képességeket.

AWS Blog·3 heteAI

Modellek & LLM

A Tencent új AI-modellje felülmúlja a GLM-5.1-et, de alulmarad a GLM-5.2 mellett

A 295 milliárd paraméteres Hy3 modell 21 milliárd aktív paraméterrel és 256K kontextussal érkezik, Apache 2.0 licenccel. A Tencent szerint a modell jobb a GLM-5.1-nél, de a kódolásban alulmarad a GLM-5.2-vel szemben.

VentureBeat·3 heteAI

Modellek & LLM

Bemutatta nyílt forráskódú Hy3 AI-modelljét a Tencent, 5x nagyobb modellek teljesítményét hozza

A Tencent Hy3 modellje 21 milliárd aktív paraméterrel és 256 ezer tokenes kontextussal, állítása szerint 5x nagyobb modellek teljesítményét hozza.

The Decoder·3 heteAI

Modellek & LLM

Az AI-ügynökök fejlesztése lemarad a Meta átszervezésében

A tavaszi leépítés során a Meta 8 000 dolgozót bocsátott el, közülük 7 000-et átcsoportosított AI‑kapcsolt részlegekbe, míg a Reality Labs‑ból 1 500 főt mozdítottak ki.

HWSW·3 heteAI

Modellek & LLM

A Meituan bemutatta a 1,6 trillió paraméteres LongCat-2.0-t

A Meituan 1,6 trillió paraméteres LongCat-2.0 nyelvi modelljének natív kontextusablaka 1 millió token. A modell hazai AI ASIC szuperpodokon fut, célja az agentic kódolás.

MarkTechPost·3 heteAI

Modellek & LLM

Új AI-módszerrel gyorsulnak a robotok: emberi szintű ügyességet ígér a Humanoid

Az új KinetIQ Ascend rendszerrel a robotok akár 1,5-szeres sebességgel is képesek dolgozni, miközben a sikerrátájuk 80%-ról 98%-ra javul – közölte a Humanoid.

The Robot Report·3 heteAI

Modellek & LLM

A Qwen3 modellcsaládot új ügynökökkel fejlesztette tovább az Alibaba

Junyang Lin, az Alibaba Qwen-projekt korábbi vezetője szerint az ügynökök tanítása jelenti a jövőt, nem csupán a modellek finomhangolása. A Qwen3 modell 119 nyelvet és dialektust támogat.

MarkTechPost·3 heteAI

Modellek & LLM

GPT-5.5 kódgeneráló modellje furcsán ragad le 516 tokennél

Az OpenAI GPT-5.5 modelljének válaszai szokatlanul gyakran állnak meg pontosan 516 tokennél, ami a Hacker News egyik bejegyzése szerint a komplex feladatoknál tapasztalható teljesítményromláshoz köthető.

Hacker News·3 heteAI

Modellek & LLM

AI-szerződést köt diákaival egy tanár, nem tiltja a generatív technológiát

Tomasz Głowacki, AI-szakértő tanár, szerződést köt diákjaival a generatív AI használatáról a Science folyóiratban publikált tapasztalatai alapján.

Hacker News·3 heteAI

Modellek & LLM

Mistral AI új modellje 100%-os a matek teszteken, hibákat is talál kódban

A Mistral AI új, nyílt forráskódú Leanstral 1.5 modellje 100%-os eredményt ért el a miniF2F formális matek teljesítményteszten, és öt eddig ismeretlen hibát talált 57 nyílt forráskódú repóban.

The Decoder·3 heteAI

Modellek & LLM

Saját matematikai motort épít a Smartschool, hogy leváltsa a ChatGPT-t az oktatásban

A Smartschool 3 millió dollár seed-finanszírozást szerzett, hogy tovább fejlessze AI-alapú oktatási platformját, amely a ChatGPT-vel szemben a megbízhatóságra és a testreszabhatóságra összpontosít.

TNW·3 heteAI

Modellek & LLM

Nyílt forráskódú diffúziós ASR modellt adott ki az Interfaze hat nyelven

Az Interfaze új, nyílt forráskódú ASR modellje, a diffusion-gemma-asr-small, egyetlen, 42 millió paraméteres adapterrel hat nyelven képes beszédet felismerni.

MarkTechPost·3 heteAI

Modellek & LLM

Egy hosszabb kontextusú AI-modell 256-szorosan drágább – derül ki Vu Minh elemzéséből

Az AI-modellek kontextusablakának 512 tokenről 8192-re növelése akár 256-szoros számítási költséget is jelenthet – derül ki Chien Vu Minh Towards Data Science-ban publikált elemzéséből.

Towards Data Science·3 heteAI

Modellek & LLM

Nem gyorsult fel a Meta AI-ügynökök fejlesztése

Mark Zuckerberg szerint a Meta AI-ügynökök fejlesztése nem gyorsult fel az elmúlt négy hónapban, az átszervezés pedig nem hozta meg a várt eredményeket.

The Decoder·3 heteAI

Modellek & LLM

Anthropic Fable 5 16,1%-os automatizálási rátával dönt rekordot a távmunkában

Az Anthropic Fable 5 modellje 16,1%-os automatizálási rátával új rekordot állított fel a távmunkában, ami több mint kétszerese az előző csúcstartónak, az Opus 4.8-nak.

ZDNet AI·3 heteAI

Modellek & LLM

Anthropic 80%-kal csökkentette a Claude Code promptméretét a Fable 5 modellek miatt

Az Anthropic 80%-kal kurtította meg a Claude Code rendszer-promptját, miután a Fable 5 modellek (más néven Mythos class) jobban teljesítenek kevesebb utasítással.

The Decoder·3 heteAI

Modellek & LLM

Anthropic visszahozza a Fable modellt — globálisan elérhető a Mythos-osztályú AI

Az Anthropic bejelentette, hogy Claude Fable 5 modellje, amely a Mythos-osztályú AI-k közé tartozik, ismét globálisan elérhető.

AI Breakfast·3 heteAI

Modellek & LLM

Beszédjog az AI-kimeneteknek? Még nem dőlt el az Egyesült Államokban

Az OpenAI elleni per még korai szakaszban van, míg a Character.AI-ügy peren kívül zárult. Az AI-kimenetek beszédjogát vizsgáló ügyek középpontjában a First Amendment védelme állhat.

AI for Newsroom·3 heteAI

Modellek & LLM

Egy hétig extra díj nélkül használhatják a Claude Fable 5-öt az előfizetők

Az Anthropic július 1. és 7. között a Pro, Max, Team és Enterprise előfizetőknek a heti limitjük 50%-áig extra költség nélkül adja a Claude Fable 5-öt — az ingyenes csomagra a promóció nem vonatkozik.

Hacker News·3 heteAI

Modellek & LLM

Bemutatta adatvédelmi chatbotjának második generációját a Proton

A Proton célja, hogy a Lumo 2.0 segítségével a felhasználók adatvédelmi kérdéseit még hatékonyabban és biztonságosabban kezelje.

ZDNet AI·3 heteAI