
25%-kal gyorsítja a LLM-betanítást az Unsloth és a NVIDIA új közös fejlesztése
Az optimalizációk az Unsloth már eleve 2-5-szörös gyorsításán felül további 25%-os sebességnövekedést hoznak, az eredmények pedig pontosságvesztés nélkül érhetők el.
GPT, Claude, Gemini és más generatív AI modellek, agents, multimodális rendszerek

Az optimalizációk az Unsloth már eleve 2-5-szörös gyorsításán felül további 25%-os sebességnövekedést hoznak, az eredmények pedig pontosságvesztés nélkül érhetők el.

Az új modellekkel az OpenAI célja, hogy a hangalapú interfészek ne csak válaszoljanak, hanem valós munkát is végezzenek: hallgassanak, érveljenek, fordítsanak, átírjanak és cselekedjenek.

A Multi-Token Prediction (MTP) technológia egy könnyűsúlyú modell segítségével tippel előre tokeneket, amelyeket a fő modell párhuzamosan ellenőriz, így kihasználva a számítási ciklusokat.

Idén ősszel az iOS 27, iPadOS 27 és macOS 27 rendszereken a felhasználók saját preferenciáik szerint választhatnak külső AI-modellt a beépített funkciókhoz. A változás az Apple operációs rendszereinek következő frissítésével érkezik.

Az új GPT-5.5 Instant modell 52,5%-kal kevesebb hallucinált állítást tartalmaz, mint elődje, és 37,3%-kal pontosabban válaszol a kihívást jelentő kérdésekre.

Az új modell, amely a ChatGPT minden felhasználója számára elérhető, a korábbi verzióknál lényegesen jobb teljesítményt nyújt a ténybeli pontosság és a válaszok tömörsége terén.

Az új modell zárt hurkú rendszerként működik, így nemcsak a szöveget, hanem a beszélgetés teljes hanganyagát is elemzi, felismerve a felhasználó hangszínét, tempóját és érzelmi állapotát.

Az új modell jelentősen javítja a matematikai, tudományos és vizuális érvelési teljesítményteszt eredményeket, miközben a válaszok rövidebbek és lényegre törőbbek.

A Benedict Brady által létrehozott Philosophy Bench 100 etikai dilemmával szembesítette a vezető modelleket, felmérve, hogy válaszaik inkább következmény- vagy kötelességorientáltak-e.

A Pinecone Nexus egy új tudásmotor, amely a hagyományos RAG-megközelítés helyett egy fordítási fázisban értelmezi és strukturálja a tudást, jelentősen növelve az AI-ügynökök hatékonyságát.

A modell hibrid és tömörített figyelmi mechanizmusokkal éri el a hatalmas kontextusablakot, és már elérhető webes, applikációs és API-felületeken is.

A FlashKDA egy nagy teljesítményű, CUTLASS-alapú kernel implementációja a Kimi Delta Attentionnek (KDA), amely MIT licenc alatt érhető el GitHubon.

A modell a képeket közvetlenül dolgozza fel, ezzel elkerüli a hagyományos módszerekre jellemző, erőforrásigényes szöveggé alakítást.

Egy kritikus hibát talált és javított az Unsloth a Mistral Medium 3.5 modellben, ezzel rávilágítva az AI-eszközök fejlesztésének kulcsfontosságú szerepére.

A GPT-5.1 modellek megjelenése után a válaszokban elszaporodtak a goblinok, gremlinek és más mitikus lények, ami a mesterséges intelligencia tréningjének mélyebb problémáira világít rá.

Az OpenAI GPT-5.5 modellje hasonló teljesítményszintet ért el a kiberbiztonsági teszteken, mint az Anthropic Mythos Preview-ja. A brit AI Security Institute (AISI) 2023 óta végzett tesztek alapján állapította meg ezt.

A Qwen-Scope a Qwen3 és Qwen3.5 modellcsaládokra betanított sparse autoencoder (SAE) csomag, amely 7 modellváltozaton keresztül 14 SAE súlycsoportot tartalmaz.

A fejlesztők már most beépíthetik a DLSS 4.5 Dynamic Multi Frame Generation funkciót, amely jelentősen növeli a képkockasebességet anélkül, hogy a válaszkészség csökkenne.

A cég most a játék‑ és robotikai szektorokra irányuló általános világmodellek építését indítja el.

Fejlesztők most integrálhatják a FlashQLA‑t, és akár háromszoros gyorsulást érhetnek el a GDN lineáris figyelmében NVIDIA Hopper GPU-ken.

Az OpenAI a GPT-5.5 modellhez egy szigorú rendszerutasítást adta ki, amely csak akkor engedélyezi az állati vagy mitológiai lények említését, ha a felhasználó kérdése egyértelműen rá vonatkozik.
Tetszik az oldal? Támogasd a fejlesztést
Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.