ÉlőUtoljára: 1 órájaMa: 23

Rovat · 14. oldal

Kutatás

AI research papers, arXiv publikációk, benchmarkok, tudományos áttörések

813 cikk az archívumban

Bitstream diffúzióval zárja az autoregresszív rést a nyelvmodellezésben az új megközelítés
Kutatás

Bitstream diffúzióval zárja az autoregresszív rést a nyelvmodellezésben az új megközelítés

A diffúziós nyelvmodellek (DLM) eddig elmaradtak az autoregresszív társaiktól a mintaminőség és a diverzitás terén, de az új megközelítés ezt a hiányosságot igyekszik felszámolni.

ArXiv NLP·AI
Hosszabb gondolkodás, nagyobb torzítás: a DeepSeek-R1 is pozíció-elfogult a válaszokban
Kutatás

Hosszabb gondolkodás, nagyobb torzítás: a DeepSeek-R1 is pozíció-elfogult a válaszokban

A DeepSeek-R1 és más, gondolkodásra hangolt modellek esetében a válaszok pozíció-elfogultsága egyenesen arányos a gondolkodási folyamat hosszával — derül ki egy új kutatásból.

ArXiv AI·AI
Új dekódolási módszerrel csökken a VLM-ek hallucinációja
Kutatás

Új dekódolási módszerrel csökken a VLM-ek hallucinációja

A módszer a vizuális jellemzők alulsúlyozására épülő figyelem-egyensúlyhiányt korrigálja a nyelvi modellekben, jelentősen javítva a válaszok pontosságát.

ArXiv ML·AI
Rejtett koalíciókat azonosít a többügynökös AI-ban az új spektrális diagnosztika
Kutatás

Rejtett koalíciókat azonosít a többügynökös AI-ban az új spektrális diagnosztika

A módszer a belső neurális reprezentációkból épít páronkénti kölcsönös információs gráfot, majd spektrális partícionálással azonosítja a legfontosabb koalíciós határokat.

ArXiv AI·AI
Könnyű hibrid modell oldja meg a tádzsik-perzsa lexikai egyeztetést 96,4%-os pontossággal
Kutatás

Könnyű hibrid modell oldja meg a tádzsik-perzsa lexikai egyeztetést 96,4%-os pontossággal

A kutatók által fejlesztett könnyű hibrid megoldás felülmúlja a nagyobb, többnyelvű transzformátorokat a specifikus lexikai egyeztetésben, miközben hatékonyan futtatható egyszerűbb hardveren is.

ArXiv NLP·AI
A CASCADE rendszerrel tanulnak a nyelvi modellek telepítés után is
Kutatás

A CASCADE rendszerrel tanulnak a nyelvi modellek telepítés után is

A CASCADE egy explicit, fejlődő epizodikus memóriával ruházza fel a LLM-alapú ágenseket, ami a természetes intelligencia adaptációs képességét utánozza.

ArXiv AI·AI
HumanNet: egymillió órányi videóval skálázza a robotikai tanulást
Kutatás

HumanNet: egymillió órányi videóval skálázza a robotikai tanulást

Az adatbázis első- és harmadik személyű nézeteket is tartalmaz, finomhangolt tevékenységeket, ember-tárgy interakciókat és hosszú távú viselkedéseket rögzít.

ArXiv CV·AI
Videógenerálást gyorsít a HSA: kevesebb lépéssel dolgozik a DiT-modellekkel
Kutatás

Videógenerálást gyorsít a HSA: kevesebb lépéssel dolgozik a DiT-modellekkel

A Heterogeneous Step Allocation (HSA) módszer a spatiotemporális tokenek sebességdinamikája alapján osztja el a zajtalanítási lépéseket, így optimalizálva a számítási költségeket.

ArXiv CV·AI
AI-modell segíti a biztosítókat: 30%-kal pontosabb aszálykockázat-becslés Franciaországban
Kutatás

AI-modell segíti a biztosítókat: 30%-kal pontosabb aszálykockázat-becslés Franciaországban

A természeti katasztrófák átlagos éves költsége 2001 és 2020 között elérte a 180-200 milliárd dollárt, ami sürgős alkalmazkodásra kényszeríti a biztosítókat.

ArXiv ML·AI
A LKV rendszer két nagyságrenddel csökkentheti a LLM-ek memóriaigényét
Kutatás

A LKV rendszer két nagyságrenddel csökkentheti a LLM-ek memóriaigényét

A Learned KV Eviction (LKV) nevű rendszer a meglévő heurisztikus módszerek korlátait áthidalva, feladat-specifikus optimalizációval kezeli a kulcs-érték (KV) gyorsítótár problémáját.

ArXiv ML·AI
LLM-összefoglalók hibásak az azonosítás elhanyagolása miatt
Kutatás

LLM-összefoglalók hibásak az azonosítás elhanyagolása miatt

A nagyméretű nyelvi modellek (LLM) alapján készült meeting-összefoglalók gyakran pontatlan tényeket tartalmaznak, mivel kihagyják az azonosítási lépést. A Towards Data Science cikke szerint ez a hiba a kimenetben nem mindig látható.

Towards Data Science·AI
40-60%-kal gyorsítja a tanulást a LANTERN AI-rendszer
Kutatás

40-60%-kal gyorsítja a tanulást a LANTERN AI-rendszer

A rendszer természetes nyelvi leírásokból generál automatákat, több forrásból aggregálja a tudást, és adaptív tanár-diák kapuzást használ a jobb teljesítmény érdekében.

ArXiv AI·AI
FinAgent-RAG: Pénzügyi dokumentumok elemzését gyorsítja az új AI-rendszer
Kutatás

FinAgent-RAG: Pénzügyi dokumentumok elemzését gyorsítja az új AI-rendszer

A rendszer a pénzügyi dokumentumokból származó kérdések megválaszolásában jeleskedik, különösen a táblázatok, szöveges narratívák és lábjegyzetek közötti összefüggések feltárásában.

ArXiv AI·AI
LLM-ekkel fedeztek fel új kvantumkémiai funkcionált – felülmúlja az emberi alapmodellt
Kutatás

LLM-ekkel fedeztek fel új kvantumkémiai funkcionált – felülmúlja az emberi alapmodellt

A sűrűségfunkcionál-elmélet (DFT) régóta fennálló kihívása az exchange-korrelációs (XC) funkcionálok pontos fejlesztése, amelyet most egy új, LLM-alapú rendszer automatizál.

ArXiv AI·AI
Új AnnE rendszerrel javítják az AI biztonsági annotációk konzisztenciáját
Kutatás

Új AnnE rendszerrel javítják az AI biztonsági annotációk konzisztenciáját

Az AnnE rendszer képes megkülönböztetni az operatív hibákat, a szakpolitikai kétértelműséget és az értékpluralizmust, amelyek az annotátorok eltérő megítéléséhez vezetnek.

ArXiv AI·AI
Token-Selective Attention: 20%-kal kevesebb számítási műveletet igényel a transzformer
Kutatás

Token-Selective Attention: 20%-kal kevesebb számítási műveletet igényel a transzformer

A Token-Selective Attention (TSA) nevű, tanult token-útválasztási technika a transzformerek számítási mélységét optimalizálja, így a modell hatékonyabban dolgozik.

ArXiv ML·AI
Új hibamódra bukkantak a multimodális RAG-ban: a 'recorruption' félrevezeti a MLLM-eket
Kutatás

Új hibamódra bukkantak a multimodális RAG-ban: a 'recorruption' félrevezeti a MLLM-eket

A jelenség, amelyet 'recorruption'-nak neveztek el, akkor következik be, amikor egy egyébként pontos, külső szöveges kontextus hatására a modell feladja a kezdetben helyes vizuális alapú előrejelzését.

ArXiv NLP·AI
Új védelem a LLM-ek rejtett, többfordulós támadásai ellen — elkerüli a korai elutasítást
Kutatás

Új védelem a LLM-ek rejtett, többfordulós támadásai ellen — elkerüli a korai elutasítást

A többfordulós párbeszédekben rejlő rejtett rosszindulatú szándék egyre nagyobb fenyegetést jelent a telepített nagy nyelvi modellekre (LLM-ekre), a kutatók azonban új módszerrel védekeznének.

ArXiv NLP·AI
ReaComp: 16,3 százalékponttal veri a programozó LLM-eket a szimbolikus megoldó
Kutatás

ReaComp: 16,3 százalékponttal veri a programozó LLM-eket a szimbolikus megoldó

A ReaComp a nagyméretű nyelvi modellek (LLM) érvelését fordítja le újrahasználható szimbolikus struktúrákká, ezzel kiküszöbölve a futásidejű LLM-hívásokat.

ArXiv NLP·AI
PRISM: Új módszerrel javul a robotok percepciója, 54,9%-kal jobb kódgenerálás
Kutatás

PRISM: Új módszerrel javul a robotok percepciója, 54,9%-kal jobb kódgenerálás

A PRISM keretrendszer nem passzívan fogadja el a VLM leírását, hanem a LLM kritikusan értékeli azt, célzott kérdésekkel vizsgálja a VLM-et, majd tömör kép-leírást szintetizál.

ArXiv AI·AI
Katastrofálisan veszélyes a „csendes szűrés” az új Partial Evidence Bench szerint
Kutatás

Katastrofálisan veszélyes a „csendes szűrés” az új Partial Evidence Bench szerint

Az úgynevezett „részleges bizonyíték” problémája akkor merül fel, ha a rendszerek hiányos adatokkal dolgoznak, de mégis teljesnek tűnő válaszokat adnak.

ArXiv AI·AI

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom