ÉlőUtoljára: 44 perceMa: 4

Rovat · 2. oldal

Modellek & LLM

GPT, Claude, Gemini és más generatív AI modellek, agents, multimodális rendszerek

354 cikk az archívumban

Lao nyelven is képes klónozni a hangot az új beszédszintetizátor — a szintetikus adatok korlátait áthidalva
Modellek & LLM

Lao nyelven is képes klónozni a hangot az új beszédszintetizátor — a szintetikus adatok korlátait áthidalva

A szintetikus adatokkal betanított beszédszintetizátorok elveszítik kifejezőerejüket. Új módszerekkel orvosolják ezt a problémát, és lehetővé teszik a zéró-shot hangklónozást laóul.

ArXiv NLP·AI
Norvég Nemzeti Könyvtár 2 PB Huawei flashszámmal épít saját nyelvi modellt
Modellek & LLM

Norvég Nemzeti Könyvtár 2 PB Huawei flashszámmal épít saját nyelvi modellt

A projekt a norvég nyelvre szabott nagy nyelvi modell létrehozását célozza, miközben a könyvtár 20 PB egyedi digitális anyagot 3‑2‑1 biztonsági rendszerben őriz.

Hacker News·AI
EMO moduláris MoE modell csak 12,5%-os szakértőhasználattal közel teljesítményt ér el
Modellek & LLM

EMO moduláris MoE modell csak 12,5%-os szakértőhasználattal közel teljesítményt ér el

A teljes modell teljesítményének közel 99%-át megőrizve az EMO csak a szakértők 12,5%-át aktiválja.

Hetzner: Allen AI (AI2)·AI
Az OpenAI Appshots egy gombnyomással adja át a macOS‑ablakot a Codexnek
Modellek & LLM

Az OpenAI Appshots egy gombnyomással adja át a macOS‑ablakot a Codexnek

A felhasználók egy billentyűkombinációval küldhetik a macOS‑ablak teljes szövegét a Codexnek, így a kódsegéd azonnal megkapja a feladatkörnyezetet.

The Decoder·AI
Nemotron-Labs 14B modell
Modellek & LLM

Nemotron-Labs 14B modell

A NVIDIA Nemotron-Labs Diffusion modellje akár 6,4-szer gyorsabban működhet, mint a hagyományos modellek. A modell a Hugging Face oldalán jelent meg.

Hugging Face·AI
Az Economist AI-ügynököknek szabja át weboldalait — tiszta szöveggel eteti a ChatGPT-t
Modellek & LLM

Az Economist AI-ügynököknek szabja át weboldalait — tiszta szöveggel eteti a ChatGPT-t

Az új megközelítés a meglévő tartalmakat és munkafolyamatokat úgy alakítja át, hogy az AI-ügynökök megbízhatóan felfedezhessék, elemezhessék és újra felhasználhassák azokat.

AI for Newsroom·AI
A NPO szerint véget ért a generatív AI első korszaka — napi 2,5 milliárd utasítást kezel a ChatGPT
Modellek & LLM

A NPO szerint véget ért a generatív AI első korszaka — napi 2,5 milliárd utasítást kezel a ChatGPT

A 2022 és 2025 közötti időszakot az AI-induló vállalatok robbanásszerű megjelenése és a technológia széles körű korai bevezetése jellemezte.

AI for Newsroom·AI
Google I/O 2026: Pichai az AI-ügynökök jövőjéről beszélt
Modellek & LLM

Google I/O 2026: Pichai az AI-ügynökök jövőjéről beszélt

A Google I/O 2026 konferencián Sundar Pichai beszélt az AI-ügynökökről. A technológiai áttörések formálják a jövőt.

Google AI Blog·AI
Alibaba Qwen3.7-Max 35 órán át működik autonóm módban
Modellek & LLM

Alibaba Qwen3.7-Max 35 órán át működik autonóm módban

Az új modell képes volt önállóan optimalizálni egy figyelmi kernelt egy T-Head ZW-M890 PPU-val felszerelt szerveren, amelyet korábban sosem látott.

Anthropic·AI
Qwen 3.6 35B GGUF kvantizációkat adott ki a ByteShape NTP és MTP változatokban
Modellek & LLM

Qwen 3.6 35B GGUF kvantizációkat adott ki a ByteShape NTP és MTP változatokban

A Qwen 3.6 35B modell GGUF kvantizált verzióit adta ki a ByteShape standard NTP és MTP változatokban. A MTP modellek jobb perplexitást kínálnak azonos kvantizációs szinten, ami jobb minőséget jelenthet, különösen hosszabb kontextus esetén.

Reddit LocalLLaMA·AI
Hatperces zeneszámokat generál a Stable Audio 3.0 — nyílt súlyokkal érkezik
Modellek & LLM

Hatperces zeneszámokat generál a Stable Audio 3.0 — nyílt súlyokkal érkezik

Az új modell három változata nyílt súlyokkal érhető el, a Stability AI pedig jogi kártalanítást is kínál a vállalati ügyfeleknek a szerzői jogi aggodalmak elkerülése érdekében.

The Decoder·AI
Képzés nélkül jósol táblázatos adatokból a H2O.ai új tabH2O modellje
Modellek & LLM

Képzés nélkül jósol táblázatos adatokból a H2O.ai új tabH2O modellje

Az új rendszer in-context learning technológiát használ, kiküszöbölve a hagyományos gépi tanulási munkafolyamatokat, mint a feature engineering és az adatok tárolása.

TNW·AI
Perplexity Pro: 50%-os korlátcsökkenés
Modellek & LLM

Perplexity Pro: 50%-os korlátcsökkenés

Több felhasználó jelezte, hogy a Perplexity Pro fejlett AI-modellek használati korlátait drasztikusan csökkentette, miközben a használatuk nem emelkedett. A változásról a felhasználókat nem tájékoztatták előzetesen.

Perplexity·AI
31 nyelven szólal meg a Supertonic v3 – kevesebb olvasási hibával dolgozik
Modellek & LLM

31 nyelven szólal meg a Supertonic v3 – kevesebb olvasási hibával dolgozik

Az új, ONNX-alapú rendszer 99 millió paraméterrel működik, és a korábbi 5 nyelv helyett már 31 ISO nyelvkódot ismer, köztük a magyart is.

MarkTechPost·AI
Az IBM Granite R2 bemutatja: 97M paraméteres modell veri a 100M alatti riválisokat
Modellek & LLM

Az IBM Granite R2 bemutatja: 97M paraméteres modell veri a 100M alatti riválisokat

A 97 millió paraméteres kompakt modell 60,3 pontot ért el a MTEB Multilingual Retrieval teljesítményteszten, ezzel felülmúlva minden nyílt, 100 millió paraméter alatti riválisát.

Hugging Face·AI
API-n keresztül nyitja meg Uni-1.1 képmodelljét a Luma — ára és minősége az OpenAI-t és a Google-t is eléri
Modellek & LLM

API-n keresztül nyitja meg Uni-1.1 képmodelljét a Luma — ára és minősége az OpenAI-t és a Google-t is eléri

A REST felületen keresztül a fejlesztők szöveges parancsokkal generálhatnak és szerkeszthetnek képeket, akár kilenc referenciafotó felhasználásával.

The Decoder·AI
AntAngelMed: 103 milliárd paraméteres orvosi modell nyílt forráskóddal, 7-szeres hatékonysággal
Modellek & LLM

AntAngelMed: 103 milliárd paraméteres orvosi modell nyílt forráskóddal, 7-szeres hatékonysággal

Az új modell a Mixture-of-Experts (MoE) architektúrát használja 1/32-es aktiválási aránnyal, így futás közben mindössze 6,1 milliárd paraméter aktív.

MarkTechPost·AI
26 milliós paraméterű AI-modellt desztillált a Cactus Compute a Gemini 3.1-ből
Modellek & LLM

26 milliós paraméterű AI-modellt desztillált a Cactus Compute a Gemini 3.1-ből

A „Simple Attention Network” architektúrára épülő modell a Gemini 3.1 eszközhívási funkcióit képes utánozni, miközben a FunctionGemma-270m-et is felülmúlja.

Hacker News·AI
94 százalékkal csökkenti a betanítási költségeket a Baidu Ernie 5.1 modellje
Modellek & LLM

94 százalékkal csökkenti a betanítási költségeket a Baidu Ernie 5.1 modellje

A Baidu Ernie 5.1 modellje 94 százalékkal csökkenti a betanítási költségeket a hasonló modellekhez képest. A modell a Search Arena ranglistán május 9-én a 4. helyen végzett.

The Decoder·AI
NVIDIA Star Elastic: egyetlen modellben 30, 23 és 12 milliárd paraméteres változat
Modellek & LLM

NVIDIA Star Elastic: egyetlen modellben 30, 23 és 12 milliárd paraméteres változat

Az új megközelítés egyetlen ellenőrzőpontban tárolja a 30 milliárd, 23 milliárd és 12 milliárd paraméteres modelleket, így nincs szükség külön finomhangolásra.

MarkTechPost·AI
Google: AI Overviews
Modellek & LLM

Google: AI Overviews

A Google az AI Overviews funkción belül több külső hivatkozást jelenít meg a generált válaszokban. A változtatás a kiadók aggodalmaira reagál, akik a mesterséges intelligencia alapú keresés miatt csökkenő forgalmat tapasztalnak.

Ars Technica·AI

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom