ÉlőUtoljára: 14 perceMa: 5

Rovat · 3. oldal

Modellek & LLM

GPT, Claude, Gemini és más generatív AI modellek, agents, multimodális rendszerek

354 cikk az archívumban

25%-kal gyorsítja a LLM-betanítást az Unsloth és a NVIDIA új közös fejlesztése
Modellek & LLM

25%-kal gyorsítja a LLM-betanítást az Unsloth és a NVIDIA új közös fejlesztése

Az optimalizációk az Unsloth már eleve 2-5-szörös gyorsításán felül további 25%-os sebességnövekedést hoznak, az eredmények pedig pontosságvesztés nélkül érhetők el.

Hacker News·AI
GPT-5 szintű érveléssel érkezik az OpenAI új hangmodellje, a GPT-Realtime-2
Modellek & LLM

GPT-5 szintű érveléssel érkezik az OpenAI új hangmodellje, a GPT-Realtime-2

Az új modellekkel az OpenAI célja, hogy a hangalapú interfészek ne csak válaszoljanak, hanem valós munkát is végezzenek: hallgassanak, érveljenek, fordítsanak, átírjanak és cselekedjenek.

Techmeme·AI
Háromszoros sebességnövekedést hozhat a Google Gemma 4 modelljeinek spekulatív dekódolása
Modellek & LLM

Háromszoros sebességnövekedést hozhat a Google Gemma 4 modelljeinek spekulatív dekódolása

A Multi-Token Prediction (MTP) technológia egy könnyűsúlyú modell segítségével tippel előre tokeneket, amelyeket a fő modell párhuzamosan ellenőriz, így kihasználva a számítási ciklusokat.

Ars Technica·AI
iOS 27: Saját AI-modellek választhatók lesznek az Apple Intelligence-ben
Modellek & LLM

iOS 27: Saját AI-modellek választhatók lesznek az Apple Intelligence-ben

Idén ősszel az iOS 27, iPadOS 27 és macOS 27 rendszereken a felhasználók saját preferenciáik szerint választhatnak külső AI-modellt a beépített funkciókhoz. A változás az Apple operációs rendszereinek következő frissítésével érkezik.

The Verge·AI
52,5%-kal kevesebb hallucinációt produkál az új GPT-5.5 Instant a ChatGPT-ben
Modellek & LLM

52,5%-kal kevesebb hallucinációt produkál az új GPT-5.5 Instant a ChatGPT-ben

Az új GPT-5.5 Instant modell 52,5%-kal kevesebb hallucinált állítást tartalmaz, mint elődje, és 37,3%-kal pontosabban válaszol a kihívást jelentő kérdésekre.

VentureBeat·AI
GPT-5.5 Instant: okosabb és személyre szabottabb válaszokat ígér az OpenAI
Modellek & LLM

GPT-5.5 Instant: okosabb és személyre szabottabb válaszokat ígér az OpenAI

Az új modell, amely a ChatGPT minden felhasználója számára elérhető, a korábbi verzióknál lényegesen jobb teljesítményt nyújt a ténybeli pontosság és a válaszok tömörsége terén.

OpenAI·AI
Az Inworld AI bemutatta a Realtime TTS-2-t: a modell 100 nyelven is megérti a hangulatot
Modellek & LLM

Az Inworld AI bemutatta a Realtime TTS-2-t: a modell 100 nyelven is megérti a hangulatot

Az új modell zárt hurkú rendszerként működik, így nemcsak a szöveget, hanem a beszélgetés teljes hanganyagát is elemzi, felismerve a felhasználó hangszínét, tempóját és érzelmi állapotát.

MarkTechPost·AI
52,5%-kal kevesebb hallucinációt ígér a ChatGPT új GPT-5.5 Instant modellje
Modellek & LLM

52,5%-kal kevesebb hallucinációt ígér a ChatGPT új GPT-5.5 Instant modellje

Az új modell jelentősen javítja a matematikai, tudományos és vizuális érvelési teljesítményteszt eredményeket, miközben a válaszok rövidebbek és lényegre törőbbek.

The Decoder·AI
A Claude megtagadja, a Grok végrehajtja: eltérő etikai irányt mutatnak a vezető AI-modellek
Modellek & LLM

A Claude megtagadja, a Grok végrehajtja: eltérő etikai irányt mutatnak a vezető AI-modellek

A Benedict Brady által létrehozott Philosophy Bench 100 etikai dilemmával szembesítette a vezető modelleket, felmérve, hogy válaszaik inkább következmény- vagy kötelességorientáltak-e.

The Decoder·AI
A Pinecone Nexus 98%-kal csökkenti az AI-ügynökök tokenfelhasználását
Modellek & LLM

A Pinecone Nexus 98%-kal csökkenti az AI-ügynökök tokenfelhasználását

A Pinecone Nexus egy új tudásmotor, amely a hagyományos RAG-megközelítés helyett egy fordítási fázisban értelmezi és strukturálja a tudást, jelentősen növelve az AI-ügynökök hatékonyságát.

VentureBeat·AI
DeepSeek V4-et adott ki a kínai cég — 1M token kontextussal és MoE skálázással
Modellek & LLM

DeepSeek V4-et adott ki a kínai cég — 1M token kontextussal és MoE skálázással

A modell hibrid és tömörített figyelmi mechanizmusokkal éri el a hatalmas kontextusablakot, és már elérhető webes, applikációs és API-felületeken is.

Last Week in AI·AI
Akár 2,22-szeres gyorsulást hoz a Moonshot AI nyílt forráskódú FlashKDA-ja a NVIDIA H20 GPU-kon
Modellek & LLM

Akár 2,22-szeres gyorsulást hoz a Moonshot AI nyílt forráskódú FlashKDA-ja a NVIDIA H20 GPU-kon

A FlashKDA egy nagy teljesítményű, CUTLASS-alapú kernel implementációja a Kimi Delta Attentionnek (KDA), amely MIT licenc alatt érhető el GitHubon.

MarkTechPost·AI
Közvetlen képértelmezést kínál a SenseTime nyílt forráskódú SenseNova-U1 modellje
Modellek & LLM

Közvetlen képértelmezést kínál a SenseTime nyílt forráskódú SenseNova-U1 modellje

A modell a képeket közvetlenül dolgozza fel, ezzel elkerüli a hagyományos módszerekre jellemző, erőforrásigényes szöveggé alakítást.

Techmeme·AI
Az Unsloth hibát javított a Mistral Medium 3.5 modellben — a tooling szerepe kulcsfontosságú
Modellek & LLM

Az Unsloth hibát javított a Mistral Medium 3.5 modellben — a tooling szerepe kulcsfontosságú

Egy kritikus hibát talált és javított az Unsloth a Mistral Medium 3.5 modellben, ezzel rávilágítva az AI-eszközök fejlesztésének kulcsfontosságú szerepére.

Mistral AI·AI
175 százalékkal nőtt a „goblin” említések száma a ChatGPT-ben egy tréninghiba miatt
Modellek & LLM

175 százalékkal nőtt a „goblin” említések száma a ChatGPT-ben egy tréninghiba miatt

A GPT-5.1 modellek megjelenése után a válaszokban elszaporodtak a goblinok, gremlinek és más mitikus lények, ami a mesterséges intelligencia tréningjének mélyebb problémáira világít rá.

The Decoder·AI
A GPT-5.5 felér a Mythos Preview kiberbiztonsági képességeivel — állítja az AISI
Modellek & LLM

A GPT-5.5 felér a Mythos Preview kiberbiztonsági képességeivel — állítja az AISI

Az OpenAI GPT-5.5 modellje hasonló teljesítményszintet ért el a kiberbiztonsági teszteken, mint az Anthropic Mythos Preview-ja. A brit AI Security Institute (AISI) 2023 óta végzett tesztek alapján állapította meg ezt.

Ars Technica·AI
Qwen-Scope: nyílt forráskódú SAE-csomaggal teszi értelmezhetővé a LLM-ek belső működését a Qwen AI
Modellek & LLM

Qwen-Scope: nyílt forráskódú SAE-csomaggal teszi értelmezhetővé a LLM-ek belső működését a Qwen AI

A Qwen-Scope a Qwen3 és Qwen3.5 modellcsaládokra betanított sparse autoencoder (SAE) csomag, amely 7 modellváltozaton keresztül 14 SAE súlycsoportot tartalmaz.

MarkTechPost·AI
DLSS 4.5 bevezeti a Dynamic Multi Frame Generation-t a játékokban
Modellek & LLM

DLSS 4.5 bevezeti a Dynamic Multi Frame Generation-t a játékokban

A fejlesztők már most beépíthetik a DLSS 4.5 Dynamic Multi Frame Generation funkciót, amely jelentősen növeli a képkockasebességet anélkül, hogy a válaszkészség csökkenne.

Nvidia Developer·AI
Runway a $860 millió befektetés után a világmodellekre fókuszál
Modellek & LLM

Runway a $860 millió befektetés után a világmodellekre fókuszál

A cég most a játék‑ és robotikai szektorokra irányuló általános világmodellek építését indítja el.

TechCrunch·AI
FlashQLA 3× gyorsabb a NVIDIA Hopper GPU-ken – nyílt forráskódú
Modellek & LLM

FlashQLA 3× gyorsabb a NVIDIA Hopper GPU-ken – nyílt forráskódú

Fejlesztők most integrálhatják a FlashQLA‑t, és akár háromszoros gyorsulást érhetnek el a GDN lineáris figyelmében NVIDIA Hopper GPU-ken.

MarkTechPost·AI
OpenAI Codex GPT-5.5 tiltja a fantázianemű állatnevek használatát
Modellek & LLM

OpenAI Codex GPT-5.5 tiltja a fantázianemű állatnevek használatát

Az OpenAI a GPT-5.5 modellhez egy szigorú rendszerutasítást adta ki, amely csak akkor engedélyezi az állati vagy mitológiai lények említését, ha a felhasználó kérdése egyértelműen rá vonatkozik.

Simon Willison·AI

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom