Rovat · 31. oldal

Kutatás

AI research papers, arXiv publikációk, benchmarkok, tudományos áttörések

1159 cikk az archívumban

AI-modell segíti a biztosítókat: 30%-kal pontosabb aszálykockázat-becslés Franciaországban

A természeti katasztrófák átlagos éves költsége 2001 és 2020 között elérte a 180-200 milliárd dollárt, ami sürgős alkalmazkodásra kényszeríti a biztosítókat.

ArXiv ML·2 hónapjaAI

Kutatás

A LKV rendszer két nagyságrenddel csökkentheti az LLM-ek memóriaigényét

A Learned KV Eviction (LKV) nevű rendszer a meglévő heurisztikus módszerek korlátait áthidalva, feladat-specifikus optimalizációval kezeli a kulcs-érték (KV) gyorsítótár problémáját.

ArXiv ML·2 hónapjaAI

Kutatás

LLM-összefoglalók hibásak az azonosítás elhanyagolása miatt

A nagyméretű nyelvi modellek (LLM) alapján készült meeting-összefoglalók gyakran pontatlan tényeket tartalmaznak, mivel kihagyják az azonosítási lépést. A Towards Data Science cikke szerint ez a hiba a kimenetben nem mindig látható.

Towards Data Science·2 hónapjaAI

Kutatás

40-60%-kal gyorsítja a tanulást a LANTERN AI-rendszer

A rendszer természetes nyelvi leírásokból generál automatákat, több forrásból aggregálja a tudást, és adaptív tanár-diák kapuzást használ a jobb teljesítmény érdekében.

ArXiv AI·2 hónapjaAI

Kutatás

FinAgent-RAG: Pénzügyi dokumentumok elemzését gyorsítja az új AI-rendszer

A rendszer a pénzügyi dokumentumokból származó kérdések megválaszolásában jeleskedik, különösen a táblázatok, szöveges narratívák és lábjegyzetek közötti összefüggések feltárásában.

ArXiv AI·2 hónapjaAI

Kutatás

LLM-ekkel fedeztek fel új kvantumkémiai funkcionált – felülmúlja az emberi alapmodellt

A sűrűségfunkcionál-elmélet (DFT) régóta fennálló kihívása az exchange-korrelációs (XC) funkcionálok pontos fejlesztése, amelyet most egy új, LLM-alapú rendszer automatizál.

ArXiv AI·2 hónapjaAI

Kutatás

Új AnnE rendszerrel javítják az AI biztonsági annotációk konzisztenciáját

Az AnnE rendszer képes megkülönböztetni az operatív hibákat, a szakpolitikai kétértelműséget és az értékpluralizmust, amelyek az annotátorok eltérő megítéléséhez vezetnek.

ArXiv AI·2 hónapjaAI

Kutatás

Token-Selective Attention: 20%-kal kevesebb számítási műveletet igényel a transzformer

A Token-Selective Attention (TSA) nevű, tanult token-útválasztási technika a transzformerek számítási mélységét optimalizálja, így a modell hatékonyabban dolgozik.

ArXiv ML·2 hónapjaAI

Kutatás

Új hibamódra bukkantak a multimodális RAG-ban: a 'recorruption' félrevezeti a MLLM-eket

A jelenség, amelyet 'recorruption'-nak neveztek el, akkor következik be, amikor egy egyébként pontos, külső szöveges kontextus hatására a modell feladja a kezdetben helyes vizuális alapú előrejelzését.

ArXiv NLP·2 hónapjaAI

Kutatás

Új védelem az LLM-ek rejtett, többfordulós támadásai ellen — elkerüli a korai elutasítást

A többfordulós párbeszédekben rejlő rejtett rosszindulatú szándék egyre nagyobb fenyegetést jelent a telepített nagy nyelvi modellekre (LLM-ekre), a kutatók azonban új módszerrel védekeznének.

ArXiv NLP·2 hónapjaAI

Kutatás

ReaComp: 16,3 százalékponttal veri a programozó LLM-eket a szimbolikus megoldó

A ReaComp a nagyméretű nyelvi modellek (LLM) érvelését fordítja le újrahasználható szimbolikus struktúrákká, ezzel kiküszöbölve a futásidejű LLM-hívásokat.

ArXiv NLP·2 hónapjaAI

Kutatás

PRISM: Új módszerrel javul a robotok percepciója, 54,9%-kal jobb kódgenerálás

A PRISM keretrendszer nem passzívan fogadja el a VLM leírását, hanem az LLM kritikusan értékeli azt, célzott kérdésekkel vizsgálja a VLM-et, majd tömör kép-leírást szintetizál.

ArXiv AI·2 hónapjaAI

Kutatás

Katastrofálisan veszélyes a „csendes szűrés” az új Partial Evidence Bench szerint

Az úgynevezett „részleges bizonyíték” problémája akkor merül fel, ha a rendszerek hiányos adatokkal dolgoznak, de mégis teljesnek tűnő válaszokat adnak.

ArXiv AI·2 hónapjaAI

Kutatás

Orvosi képek elemzését segíti a Counterfactual GAN — a radiológusok munkáját gyorsítja

A technika a generatív ellenhálózati (GAN) modellekre épül, ciklikusan konzisztens veszteségfüggvénnyel, ami a hagyományos diszkriminatív módszerek hiányosságait orvosolja.

ArXiv CV·2 hónapjaAI

Kutatás

GeoQuery: új rendszerrel gyorsul a műholdképek keresése katasztrófahelyzetben

A rendszer a CLAY vizuális beágyazásokat szöveges leírásokkal kapcsolja össze, így a felhasználók természetes nyelven kereshetnek a hatalmas adatbázisban.

ArXiv CV·2 hónapjaAI

Kutatás

A neurális hálózatok „lapos minimumai” csak illúziók – állítja egy új kutatás

A neurális hálózatok generalizációs képessége nem a veszteségfüggvény lapos régióival függ össze, hanem a „gyengeség” fogalmában rejlik. A neurális hálózatok általánosítási képessége más tényezőkön múlik, mint eddig gondolták.

ArXiv ML·2 hónapjaAI

Kutatás

Személyi asszisztensek adatvédelmi és költségproblémáit oldhatja meg az új LLM-módszer

A felhőalapú modellek eddig érzékeny adatokat is továbbítottak, míg a helyi megoldások megbízhatatlanabbak voltak, most azonban a feladatokat könnyűsúlyú modulokban tanulja meg a rendszer.

ArXiv AI·2 hónapjaAI

Kutatás

Új SAT módszerrel hangolhatók össze a kisebb LLM-ek — koordinátor nélkül

A Sequential Agent Tuning (SAT) eljárás blokk-koordinált frissítéseket alkalmaz az ügynökökön, így központi vezérlő nélkül is skálázható és decentralizált betanítást tesz lehetővé.

ArXiv ML·2 hónapjaAI

Kutatás

Diákok érveit értékelték AI és emberi tanárok: a kritikus gondolkodás kulcsa a logika

A generatív mesterséges intelligencia (GenAI) széles körű elterjedése ellenére a diákok képesek logikus ellenérveket megfogalmazni az AI-generált tartalomra — derült ki egy új tanulmányból.

ArXiv NLP·2 hónapjaAI

Kutatás

Új modell generál lekérdezéseket meglévő összefoglaló adathalmazokból

A Query-Focused Summarization (QFS) feladatokhoz szükséges nagyméretű adathalmazok hiányát orvosolja egy új, bizonyítékalapú modell, amely lekérdezéseket generál meglévő, lekérdezés nélküli adathalmazokból.

ArXiv NLP·2 hónapjaAI

Kutatás

Új DVBL rendszer tanulja az adatokból a bázisfüggvényeket — neuralis hálózatok nélkül

A DVBL a bázisatomokat elsődleges optimalizálási változóként kezeli, amelyeket mintaspecifikus együtthatókkal és lineáris evolúciós operátorral együtt tanul.

ArXiv ML·2 hónapjaAI