ÉlőUtoljára: 20 órájaMa: 0 cikk

Rovat · 10. oldal

Modellek & LLM

GPT, Claude, Gemini és más generatív AI modellek, agents, multimodális rendszerek

578 cikk az archívumban

A Google NotebookLM frissítése: Gemini 3.5 modell és kutatási projektek

A Google NotebookLM frissítése: Gemini 3.5 modell és kutatási projektek

A Google hétfőn bejelentette, hogy a NotebookLM mostantól a Gemini 3.5 modellt használja, ami pontosabb információkat tesz lehetővé. A felhasználók így könnyebben indíthatnak kutatási projekteket, anélkül, hogy forrásokat kellene importálniuk.

The Verge·1 hónapjaAI

Egymilliárd paraméteres MI-modell indítása a Xiaomi által, másodpercenként 1000 token sebességgel

Egymilliárd paraméteres MI-modell indítása a Xiaomi által, másodpercenként 1000 token sebességgel

A Xiaomi csapata egy új, nagy sebességű MI-modellt mutatott be, amely másodpercenként 1000 token sebességgel dolgozik. A modell egy trillió paraméteres, és szabványos hardveren érte el ezt a sebességet.

MarkTechPost·1 hónapjaAI

Cerebras részvényei 3%-kal emelkednek, kilenc brókercég támogatja az AI-chip stratégiát

Cerebras részvényei 3%-kal emelkednek, kilenc brókercég támogatja az AI-chip stratégiát

A Cerebras részvényei 3%-kal emelkedtek, miután kilenc brókercég támogatta az AI-chip stratégiát. A részvény ára 207,54 dollárra emelkedett.

Reuters Technology·1 hónapjaAI

Szuperintelligencia küszöbön — állítja a Microsoft AI-vezér, de nem fél az állásvesztéstől

Szuperintelligencia küszöbön — állítja a Microsoft AI-vezér, de nem fél az állásvesztéstől

Mustafa Suleyman, a Microsoft AI vezérigazgatója szerint a szuperintelligencia hamarosan elérhető lesz. A cég hét új modellt mutatott be, és folytatja a szuperintelligencia kutatását.

The Verge·1 hónapjaAI

OpenEnv ügynökös RL-környezetekhez: nyílt forráskódúvá válik a bizottsági koordináció

OpenEnv ügynökös RL-környezetekhez: nyílt forráskódúvá válik a bizottsági koordináció

A nyílt forráskódú koordináció lehetővé teszi a fejlesztők számára, hogy hozzájáruljanak az OpenEnv fejlesztéséhez és további funkcionalitásokat adjanak a platformhoz, ami várhatóan felgyorsítja az ügynökök fejlesztését és a mesterséges intelligencia kutatásának területén.

Hugging Face·1 hónapjaAI

ChatGPT szuperappá alakul, az OpenAI az IPO előtt újít

ChatGPT szuperappá alakul, az OpenAI az IPO előtt újít

A ChatGPT szuperappá alakul, integrálva a kódolási eszközöket és AI-ügynököket. A fejlesztés célja egy átfogó, önálló feladatokat elvégző rendszer kialakítása.

MIT Technology Review·1 hónapjaAI

A Google Gemini Enterprise AI-ügynökei 34%-kal pontosabban találnak meg válaszokat

A Google Gemini Enterprise AI-ügynökei 34%-kal pontosabban találnak meg válaszokat

A Google Research új RAG keretrendszere 34%-kal növeli a ténybeli pontosságot. A Gemini Enterprise Agent Platformon keresztül érhető el.

MarkTechPost·1 hónapjaAI

Szuverén AI-modell ismeri legjobban Szingapúrt — bemutatkozott a Phoenix-VL 1.5 Medium

Szuverén AI-modell ismeri legjobban Szingapúrt — bemutatkozott a Phoenix-VL 1.5 Medium

A Phoenix-VL 1.5 Medium 2024. február 20-án debütált, mint Szingapúr első szuverén AI-modellje. A modell fejlesztésének célja a külföldi technológiai függőség csökkentése.

Mistral AI·1 hónapjaAI

A Perplexity bejelentette az első hibrid lokális-szerver inferencia orchestrátort

A Perplexity bejelentette az első hibrid lokális-szerver inferencia orchestrátort

Az első hibrid lokális-szerver inferencia orchestrátor személyi számítógépeken is futtatható, és automatikusan dönti el, mely feladatokat futtatja a felhasználó gépén, és melyeket küld a felhőbe.

Perplexity·1 hónapjaAI

Új lehetőségeket nyit a Llama.cpp a Gemma4 MTP támogatással

Új lehetőségeket nyit a Llama.cpp a Gemma4 MTP támogatással

A Llama.cpp projekt integrálta a Gemma4 MTP támogatást, ami új lehetőségeket nyit a helyi AI-modellek futtatásában. A MTP technológia lehetővé teszi az AI-modellek számára, hogy különféle eszközöket és API-kat használjanak.

Reddit LocalLLaMA·1 hónapjaAI

GPU nélkül is gyors a Google Gemma-4-26B-A4B

GPU nélkül is gyors a Google Gemma-4-26B-A4B

A modell gyorsan fut CPU-n, 32 GB RAM-mal és egy Intel i5-8500 processzorral. A CPU-s futtatáshoz a -DGGML_CUDA=ON paramétert -DGGML_CUDA=OFF-ra kell változtatni.

Reddit LocalLLaMA·1 hónapjaAI

Gemma4 26B A4B modell problémái: a QAT változat nem működik

Gemma4 26B A4B modell problémái: a QAT változat nem működik

A Google Gemma4 26B A4B modell QAT változata nem működik megfelelően, a felhasználók rossz eredményekről számolnak be. A pontosság 70.2%-ra esik.

Reddit LocalLLaMA·1 hónapjaAI

Google Gemma 4 modellek 2-bites QAT-tal optimalizálva — mobilra és laptopra készülnek

Google Gemma 4 modellek 2-bites QAT-tal optimalizálva — mobilra és laptopra készülnek

A Google új Gemma 4 modelljei 2-bites QAT-val készültek, hogy csökkentsék a memóriaigényt. A Gemma-4-E2B-it és Gemma-4-E4B-it modellek mobilkészülékekre optimalizálva lettek.

Reddit LocalLLaMA·1 hónapjaAI

Továbbra is erős kódolásban az Anthropic Opus 4.8 modellje, de drágább és lassabb lett

Továbbra is erős kódolásban az Anthropic Opus 4.8 modellje, de drágább és lassabb lett

Az Anthropic Opus 4.8 modelljének új tokenizálója kevésbé hatékony, ami lassabb és drágább működést eredményez. A fejlesztőknek most három lehetőségük maradt a korábbiakhoz képest.

Anthropic·1 hónapjaAI

Új MTP GGUF súlyokat adott ki az Unsloth a Gemma 4 modellekhez

Új MTP GGUF súlyokat adott ki az Unsloth a Gemma 4 modellekhez

Az Unsloth új MTP GGUF súlyokat tett elérhetővé a Gemma 4 AI-modellhez. A súlyok Q8, F16 és BF16 formátumokban érhetők el.

Reddit LocalLLaMA·1 hónapjaAI

Google Gemma 4 QAT modell pontossága ingadozik a Reddit szerint

Google Gemma 4 QAT modell pontossága ingadozik a Reddit szerint

A Google Gemma 4 QAT modelljeinek pontossága nem egyenletes, különösen a naiv konverzió során. A felhasználók a Reddit fórumon osztották meg tapasztalataikat a kvantált modellek pontatlanságáról.

Reddit LocalLLaMA·1 hónapjaAI

Kisebb GGUF-modellekkel robbanhat az AI — új fejlesztések jönnek

Kisebb GGUF-modellekkel robbanhat az AI — új fejlesztések jönnek

A fejlesztések célja, hogy a kisebb GGUF-modellek teljesítményét tovább növeljék, miközben kompatibilisek maradnak a szokásos helyi inferenciaeszközökkel.

Reddit LocalLLaMA·1 hónapjaAI

Háromszor kevesebb memóriát igényelnek az Unsloth új Gemma 4 modellei

Háromszor kevesebb memóriát igényelnek az Unsloth új Gemma 4 modellei

Az Unsloth kiadta a Gemma 4 modelleket GGUF formátumban, amelyek a QAT technológiának köszönhetően akár háromszorosára csökkentik a memóriaigényt. A kiadásban szereplő modellek között megtalálhatóak a 12B, 26B, A4B és 31B paraméteres verziók.

Reddit LocalLLaMA·1 hónapjaAI

Új Gemma 4 modellek kevesebb memóriát használnak minőségromlás nélkül

Új Gemma 4 modellek kevesebb memóriát használnak minőségromlás nélkül

A Google új Gemma 4 modelljei 2024-ben jelentek meg, és a fejlesztésnek köszönhetően akár 50%-kal kevesebb memóriát is igényelhetnek.

Reddit LocalLLaMA·1 hónapjaAI

Google kiadta a Gemma 4 Heretic modellt — cenzúrázatlan válaszokat ígér

Google kiadta a Gemma 4 Heretic modellt — cenzúrázatlan válaszokat ígér

A Google elérhetővé tette a Gemma 4 Heretic modellt, amely a cenzúrázatlan válaszok mellett megőrzi az alapmodell intelligenciáját. A verzió ideális egyedi finomhangoláshoz és kutatási célokra.

Reddit LocalLLaMA·1 hónapjaAI

Kódolásban lemaradt a GLM 4.7 Turbo, a GLM 5.1 túl nagy a legtöbb felhasználónak

Kódolásban lemaradt a GLM 4.7 Turbo, a GLM 5.1 túl nagy a legtöbb felhasználónak

A GLM 4.7 Turbo nem elég jó kódoláshoz, míg a GLM 5.1 túl nagy és lassú a legtöbb felhasználó számára. Az Air modell frissítése lenne a megoldás.

Reddit LocalLLaMA·1 hónapjaAI

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.