Rovat · 11. oldal

Modellek & LLM

GPT, Claude, Gemini és más generatív AI modellek, agents, multimodális rendszerek

578 cikk az archívumban

A Linux felhasználók továbbra sem kapnak hivatalos grafikus felületet a Claude Desktophoz

A Linux felhasználók nem kapnak hivatalos grafikus felületet, pedig az Anthropic már használja a rendszert. A fejlesztők a Claude Code pluginjeinek tesztelését hiányolják.

Hacker News·1 hónapjaAI

Modellek & LLM

OpenAI is still working on that ‘super app’

A következő hetekben érkezik a ChatGPT új verziója, amely kódolóeszközökkel és AI-ügynökökkel bővül. Az Anthropic elleni verseny miatt az üzleti ügyfelek körében növeli a versenyképességét.

TechCrunch·1 hónapjaAI

Modellek & LLM

Jelentősen növeli a kontextus ablak méretét a Qwen3.6 27B modell a KV cache RAM-ba mentésével

Egy felhasználó tapasztalatai szerint a Qwen3.6 27B modell 16 GB VRAM-mal és 32 GB DDR5 RAM-mal futtatva a KV cache RAM-ba mentésével jelentősen növelhető a kontextus ablak mérete. A sebességcsökkenés minimális, 14 tps érhető el.

Reddit LocalLLaMA·1 hónapjaAI

Modellek & LLM

Új AI-funkciókat mutat be az Apple a WWDC-n

A 2026. június 7-én tartott WWDC-n mutatják be az új AI-funkciókat, és egy frissített Siri-t. Az iOS 27 operációs rendszerrel együtt jelentik be.

Bloomberg Technology·1 hónapjaAI

Modellek & LLM

Apple elismerte AI-kudarcait, Tim Cook bekapcsolódott a fejlesztésbe

A cég mesterséges intelligencia stratégiájának átalakítása érdekében számos új technológiai fejlesztést tervez bevezetni, amelyek célja, hogy felzárkózzon a technológiai versenytársaihoz.

Techmeme·1 hónapjaAI

Modellek & LLM

A Perplexity forradalmasítja a keresést: 85%-kal kevesebb tokennel dolgozik az új rendszer

A Perplexity új, Search as Code (SaC) architektúrájával az AI modellek egyedi Python szkripteket írhatnak a keresési feladatokhoz, ami 85%-kal csökkenti a tokenhasználatot a korábbi megoldásokhoz képest.

The Decoder·1 hónapjaAI

Modellek & LLM

A Huawei chipekkel ért el áttörést a kínai AI-szuverenitás

Huawei Ascend 910C chipekkel fejezték be a DeepSeek V4 Pro, egy 1,6 trillió paraméteres AI-modell utóbetanítását. A lépés a kínai chipipar önállósodási törekvéseit erősíti.

Techmeme·1 hónapjaAI

Modellek & LLM

A Bloomberg Tech konferencián az AI-finanszírozás a fő téma

A Bloomberg Tech konferencián a mesterséges intelligencia fejlesztése és a tőke megszerzése volt a fő téma. A konferencián a technológiai iparágban zajló drámákról szóló podcastok is szerepet kaptak.

Bloomberg Technology·1 hónapjaAI

Modellek & LLM

Kódolóeszközökkel és AI-ügynökökkel bővíti a ChatGPT-t az OpenAI

A következő hetekben az OpenAI kódolóeszközökkel és AI-ügynökökkel bővíti a platformot, hogy a felhasználókat magasabb árrésű termékek felé terelje. A cél az, hogy a ChatGPT egyfajta átjáró legyen a jövőbeli szolgáltatásokhoz.

Techmeme·1 hónapjaAI

Modellek & LLM

Dinamikus kvantálást vezet be az AWQ modell frissítése

Az AWQ modell frissítése dinamikus kvantálást vezet be, ami a Qwen3.6 modellek teljesítményét javítja. A fejlesztés új lehetőségeket nyit meg a modellalkalmazások számára.

Reddit LocalLLaMA·1 hónapjaAI

Modellek & LLM

Mira Murati, az OpenAI korábbi vezérigazgatója figyelmeztet az AI-iparág kormányzásának hiányára és bemutatja az új interaction modellt

Mira Murati 18 hónap után először szólalt meg nyilvánosan, ahol hangsúlyozta, hogy az AI-iparágban strukturális kormányzási ellenőrzések hiányoznak. A Thinking Machines Lab új termékét, az interaction modellt is bemutatta.

TNW·1 hónapjaAI

Modellek & LLM

A Google Gemma 4 31B QAT Q4 modell teljesítménytesztje megosztja a Reddit közösségét

A Google Gemma 4 31B QAT Q4 modelljének teljesítményteszt eredményei vita tárgyát képezik a Reddit-en, mivel a felhasználók nem értenek egyet a kvantálás-tudatos képzés és a standard kvantálás által produkált számok jelentésével. A vita a Top1 KLD metrikára összpontosul.

Reddit LocalLLaMA·1 hónapjaAI

Modellek & LLM

NVIDIA DVLT 3D-s modellekhez írtak új inference engine-t

Az NVIDIA DVLT 3D-s transzformer modelljeinek futtatására kifejlesztették a dvlt.cu nevű új inference engine-t. A motor a CUDA és C++ nyelveken íródott.

Reddit LocalLLaMA·1 hónapjaAI

Modellek & LLM

DeepSeek V4 Flash támogatása érkezett a llama.cpp-hez — korai fejlesztés alatt

A DeepSeek V4 sorozat támogatása érkezett a népszerű llama.cpp nyílt forráskódú projekthez. A fejlesztés korai szakaszban jár, a PR #24162 még munkálatok alatt áll.

Reddit LocalLLaMA·1 hónapjaAI

Modellek & LLM

A Cohere új AI-modelljét teszteli a LocalLLaMA közösség

A Cohere korai hozzáférést biztosított új kódoló AI-jához, amelyet a LocalLLaMA közösség tagjai már használhatnak. A modell teljesítménye és képességei egyelőre ismeretlenek.

Reddit LocalLLaMA·1 hónapjaAI

Modellek & LLM

Az ELI rangsorolja az orosz propagandának ellenálló LLM-eket

Az ELI rangsorolja az orosz propagandának ellenálló LLM-eket, a listán szereplő modellek ellenállnak az orosz propaganda hatásának.

Ars Technica·1 hónapjaAI

Modellek & LLM

Az Anthropic Claude-ja közelít az önfejlesztéshez, a kódírás 80%-át maga végzi

A Dallas Express szerint az Anthropic Claude modellje az önfejlesztéshez közeledik. A cég közölte, hogy a Claude képes volt egy hibát okozó, rejtett hibakeresési zászlót azonosítani.

Anthropic·1 hónapjaAI

Modellek & LLM

A Claude Sonnet 4.5-ös frissítés meghibásodott, visszaálltak a 4.0-ra

Egy cég AI-rendszere meghibásodott a Claude Sonnet 4.5-ös verzióra való frissítés után, mivel a modell rosszul értelmezte a kéréseket. A fejlesztők visszaléptek a korábbi, stabil 4.0 verzióra.

VentureBeat·1 hónapjaAI

Modellek & LLM

Több mint 10 új AI-funkciót mutat be az Apple az iOS 27-ben

Az Apple hétfőn mutatja be új AI-stratégiáját, amelyben egy megújult Siri és több mint 10 új AI-funkció lesz az iOS 27-ben.

Bloomberg Technology·1 hónapjaAI

Modellek & LLM

A Google újabb Gemma 4 modellekkel bővíti kínálatát

A Google megerősítette, hogy egy 12 milliárd és egy 120 milliárd paraméteres Gemma 4 modell fejlesztése van folyamatban. A 12 milliárdos modell már elérhető és 16 GB RAM-mal futtatható laptopokon.

Reddit LocalLLaMA·1 hónapjaAI

Modellek & LLM

Az OpenAI Whisper modellje felismeri és fordítja a beszédet

Az OpenAI bemutatta a Whisper modellt, amely egy általános célú beszédfelismerő rendszer. A modell hat különböző méretben érhető el, és képes többnyelvű beszédfelismerésre, beszédfordításra és nyelvazonosításra.

Hetzner: GitHub Trending (AI)·1 hónapjaAI