Rovat

Modellek & LLM

GPT, Claude, Gemini és más generatív AI modellek, agents, multimodális rendszerek

354 cikk az archívumban

AI-feladatokat oszt szét a felhasználó gépén és a felhőben a Perplexity új rendszere

A Perplexity AI új hibrid rendszere valós időben osztja szét az AI-feladatokat a felhasználó gépe és a felhő között. A rendszer célja a mesterséges intelligenciával kapcsolatos feladatok számítási költségeinek csökkentése.

Perplexity·3 órájaAI

Modellek & LLM

ART-rendszer 20%-kal gyorsítja a LLM-ek válaszidejét — csökkenti a memóriaforgalmat

Az ART nevű új technika 20%-kal növeli a nagy nyelvi modellek generálási sebességét, miközben csökkenti a memóriaforgalmat.

ArXiv NLP·11 órájaAI

Modellek & LLM

Mistral AI: Európa legnagyobb AI laboratóriuma nem a legokosabb modellt célozza meg

A francia Mistral AI nem a tudás mennyiségét, hanem a hatékonyságot helyezi előtérbe, arra számítva, hogy a cégeknek nem lesz szükségük a legokosabb, legdrágább AI-modellekre.

Mistral AI·13 órájaAI

Modellek & LLM

Két nagyságrendet csökkent az AI a kínai nyelvtan-javításban — új módszerrel

Az új CSRP módszer 50.99 $F_{0.5}$-os eredménnyel új csúcsot állít fel a kínai nyelvtani hibajavításban, miközben 5.20 ponttal múlja felül a GPT-4-et a helyesírásban.

ArXiv NLP·17 órájaAI

Modellek & LLM

GPT-5.2 57%-kal jobb adatspecializációt hoz – önvezető AI-mérnökök dolgoznak

Az önvezető AI-mérnökök képesek végigvinni a teljes adatmérnöki folyamatot, így a GPT-5.2 által generált adatok 57,29%-kal javítják a célmodell teljesítményét.

ArXiv NLP·1 napjaAI

Modellek & LLM

Claude Opus 4.8 már tudja mondani: "Nem tudom"

Az Anthropic új Claude Opus 4.8 modellje képes beismerni, ha nem tud valamit, ami fontos lépés az AI átláthatósága felé.

Anthropic·2 napjaAI

Modellek & LLM

AI-mániában az USA: Harvard professzora szerint túlzó a lelkesedés

Az amerikai piacok szárnyalása mögött álló AI-befektetések túlzott lelkesedését kérdőjelezi meg Gita Gopinath, a Harvard közgazdász professzora.

Bloomberg Technology·3 napjaAI

Modellek & LLM

SalsaAgent: Emberrel és zenére táncol az új AI modell

A SalsaAgent nevű új modell képes emberi táncosokkal interakcióba lépni és zenére koreografált salsa mozdulatokat generálni. Az új multimodális modell a szociálisan érett robotok és interaktív virtuális ügynökök fejlesztését célozza.

ArXiv CV·3 napjaAI

Modellek & LLM

SQL-előzményekből épít tudásbázist a DataHub az AI-hallucinációk ellen

A DataHub új kontextus-intelligencia rétege SQL-lekérdezési előzményeket használ, hogy AI-ügynökök számára biztosítsa a szükséges kontextust, csökkentve a téves válaszokat.

VentureBeat·3 napjaAI

Modellek & LLM

NVIDIA X-Token: 3.82 ponttal jobb a Llama-3-nál a tudás átadásában

A NVIDIA X-Token nevű új módszere 3.82 ponttal múlja felül a GOLD-ot a Llama-3.2-1B modellen, áthidalva a különböző tokenizátorok közötti különbségeket.

MarkTechPost·4 napjaAI

Modellek & LLM

Új MoE-modell: a Liquid AI 8B-A1B 128 ezer tokenes kontextussal érkezik

A Liquid AI új, 8 milliárd paraméteres LFM2.5-8B-A1B modellje 128 ezer tokenes kontextusablakkal és 38 billió tokenen végzett betanítással fut, jelentősen csökkentve a hallucinációkat.

Hacker News·4 napjaAI

Modellek & LLM

OpenAI finomhangolja a GPT-5.5 Instantot, búcsúzik két régebbi modell

Az OpenAI frissíti a GPT-5.5 Instant modellt, olvashatóbb válaszokat ígér, miközben kivezet két régebbi AI-t.

The Decoder·4 napjaAI

Modellek & LLM

Google dupla annyi videógenerálást ad a Gemini Ultra felhasználóknak

A Google több hibát is kijavított a Gemini használati korlátainál, így az Ultra felhasználók dupla annyi videót generálhatnak.

The Decoder·4 napjaAI

Modellek & LLM

Automatizált LLM-stratégia: 69,5%-kal kevesebb token, pontosabb válaszok

Az AutoTTS keretrendszer automatikusan optimalizálja a LLM-ek számítási költségeit, akár 69,5%-kal csökkentve a tokenhasználatot pontosságvesztés nélkül.

VentureBeat·4 napjaAI

Modellek & LLM

A ChatGPT és a Gemini válaszai eltérő hangnemekre: 40%-os eltérés a pontosságban

A ChatGPT és a Gemini modellek válaszadási pontossága akár 40%-kal is eltérhet a felvetett hangnemtől függően — derült ki egy friss kutatásból. A tesztelt LLM-ek eltérő érzékenységet mutattak a különböző stílusokra.

ArXiv AI·4 napjaAI

Modellek & LLM

SIA: Önszabályozó AI-ügynök nyílt forráskóddal frissíti magát

A Hexo Labs SIA nevű, nyílt forráskódú AI-ügynök emberi beavatkozás nélkül képes frissíteni saját működési keretrendszerét és modell súlyait, 70,1%-os pontosságot érve el jogi osztályozási feladatokban.

MarkTechPost·4 napjaAI

Modellek & LLM

Anthropic Claude Opus 4.8-mal frissült — új sebességopcióval

Az Anthropic Claude Opus 4.8-as modellje új, gyorsított módot kapott, amely kedvezményesebb árat kínál a nagyvállalatoknak.

Simon Willison·4 napjaAI

Modellek & LLM

Microsoft 365 Copilot megújul: kétszer gyorsabb válaszok, letisztultabb felület

A Microsoft 365 Copilot megújult, letisztultabb dizájnt és kétszeres sebességet kínál. Az új verzió strukturáltabb, könnyebben áttekinthető válaszokat ad.

The Verge·5 napjaAI

Modellek & LLM

Perplexity AI: 5x gyorsabb tokenizálás a Hugging Face-nél

A Perplexity AI nyílt forráskódúvá tette Rustban írt Unigram tokenizerét, ami 5x gyorsabb a Hugging Face megoldásánál, és 5-6x-kal csökkenti a CPU-használatot.

MarkTechPost·5 napjaAI

Modellek & LLM

Tadzsik iskolákban tesztelik a Soro AI-chatbotot — 40 ezer példánnyal finomhangolva

A Soro LLM-család tadzsik nyelvre optimalizált, és a Gemma 3 alapjaira épül, 1,9 milliárd tokennel tanult.

ArXiv AI·5 napjaAI

Modellek & LLM

Új AI-ügynök csökkenti 73%-kal a késleltetést az edge AI-ban

A $E^3$-Agent nevű új AI-rendszer 65-73%-kal csökkenti az átlagos késleltetést az edge AI-ban, adaptív módon kezelve az erőforrásokat.

ArXiv ML·5 napjaAI