ÉlőUtoljára: 3 órájaMa: 26

Rovat · 19. oldal

Kutatás

AI research papers, arXiv publikációk, benchmarkok, tudományos áttörések

813 cikk az archívumban

Új AI: pontosabb talajvíz-szennyezés
Kutatás

Új AI: pontosabb talajvíz-szennyezés

Egy új gépi tanulási keretrendszer pontosabban előrejelezheti a talajvíz nehézfémszennyezettségét, mint a hagyományos módszerek.

ArXiv ML·AI
Fizikailag megbízhatóbb világmodellt ígér az ArXiv új Hamilton-perspektívája
Kutatás

Fizikailag megbízhatóbb világmodellt ígér az ArXiv új Hamilton-perspektívája

A jelenlegi 2D videó-generatív, 3D jelenet-központú és JEPA-szerű látens modellek nem képesek hosszú távon stabil, fizikailag megbízható előrejelzésekre.

ArXiv AI·AI
Új AEM-módszerrel javul a többfordulós RL-modellek betanítása
Kutatás

Új AEM-módszerrel javul a többfordulós RL-modellek betanítása

Az AEM a token-szintű entrópiamodulációt válasz-szintre emeli, ezzel csökkentve a mintavételezési varianciát a betanítás során.

ArXiv AI·AI
SNN-alapú tárgyfelismerés veri az ANN-t energiahatékonyságban az Intel Loihi 2-n
Kutatás

SNN-alapú tárgyfelismerés veri az ANN-t energiahatékonyságban az Intel Loihi 2-n

A technológia kulcsfontosságú lehet az energiahatékony platformokon, mint például a drónok, autonóm járművek és mobil robotok számára.

ArXiv CV·AI
AgentFloor: Kisebb nyílt forráskódú modellek is felveszik a versenyt a GPT-5-tel az ügynökfeladatokban
Kutatás

AgentFloor: Kisebb nyílt forráskódú modellek is felveszik a versenyt a GPT-5-tel az ügynökfeladatokban

Egy új teljesítményteszt, az AgentFloor, 16 nyílt forráskódú modellt vizsgált, 0,27 milliárdtól 32 milliárd paraméterig, és meglepő eredményeket hozott a GPT-5-höz képest.

ArXiv AI·AI
Pontosabb buszforgalom-előrejelzést ígér az új modell – régiókra bontja a várost
Kutatás

Pontosabb buszforgalom-előrejelzést ígér az új modell – régiókra bontja a várost

A hagyományos előrejelző rendszerek gyakran tévesen kezelik a teljes várost egységes területként, figyelmen kívül hagyva a helyi sajátosságokat.

ArXiv ML·AI
FedACT: Új AI-módszer gyorsítja a párhuzamos FL-feladatokat heterogén eszközökön
Kutatás

FedACT: Új AI-módszer gyorsítja a párhuzamos FL-feladatokat heterogén eszközökön

A decentralizált adatokon alapuló, adatvédelmi szempontból biztonságos gépi tanulás, a Federated Learning (FL) egyre több valós alkalmazásban jelenik meg, ahol több feladat osztozik az eszközparkon.

ArXiv ML·AI
Közös fogalmi alapot épít a Stanford, hogy az AI ne legyen „borzalmas kollaborátor”
Kutatás

Közös fogalmi alapot épít a Stanford, hogy az AI ne legyen „borzalmas kollaborátor”

A jelenlegi generatív AI-modellek nehezen értik a komplex kreatív utasításokat, ami frusztrálóvá teszi a művészek számára az együttműködést.

Hetzner: Stanford HAI·AI
Akár 47%-kal is ronthatja a hosszú kontextuskezelést négy apró architekturális döntés
Kutatás

Akár 47%-kal is ronthatja a hosszú kontextuskezelést négy apró architekturális döntés

A Llama 3 könnyű kiterjeszthetősége nem általánosítható más architektúrákra, ami jelentős kihívást jelent a fejlesztőknek.

Hetzner: Allen AI (AI2)·AI
Új deepfake adathalmazzal segíti a Microsoft a valós idejű felismerést
Kutatás

Új deepfake adathalmazzal segíti a Microsoft a valós idejű felismerést

A generatív AI által előállított média minősége folyamatosan javul, és a meglévő detektorok nehezen tartják a lépést az új tartalmakkal.

IEEE Spectrum AI·AI
Az LLM-ek a logikus válaszokat részesítik előnyben az utasítások ellenére is
Kutatás

Az LLM-ek a logikus válaszokat részesítik előnyben az utasítások ellenére is

A nagyméretű nyelvi modellek az érzékenységet helyezik előtérbe a szabálykövetéssel szemben, még akkor is, ha az utasítások mást diktálnának. A modellek következetesen ezt a mintát követik.

ArXiv NLP·AI
CL-bench Life: 405 valós szituációval teszteli a nyelvi modelleket
Kutatás

CL-bench Life: 405 valós szituációval teszteli a nyelvi modelleket

A 405 kontextus-feladat párból álló gyűjtemény a mindennapi élet kusza, töredékes helyzeteit szimulálja, felmérve a modellek valós idejű alkalmazhatóságát.

ArXiv NLP·AI
84,7%-os sikerrel épít ML-folyamatokat az új ötagenses AI-rendszer
Kutatás

84,7%-os sikerrel épít ML-folyamatokat az új ötagenses AI-rendszer

A rendszer 150 különböző gépi tanulási feladaton bizonyított, jelentősen felülmúlva a korábbi alapmodelleket.

ArXiv AI·AI
Új adathalmaz elemzi az AI-ügynökök gondolkodását — finomhangolási lehetőséget kínál
Kutatás

Új adathalmaz elemzi az AI-ügynökök gondolkodását — finomhangolási lehetőséget kínál

Az adathalmaz segítségével a fejlesztők mélyebben megérthetik, hogyan használnak az ügynökök eszközöket és generálnak válaszokat többfordulós beszélgetések során.

MarkTechPost·AI
YOSE: új keretrendszer gyorsítja a videóobjektum-eltávolítást, javítva a DiT-modellek sebességét
Kutatás

YOSE: új keretrendszer gyorsítja a videóobjektum-eltávolítást, javítva a DiT-modellek sebességét

A YOSE nevű finomhangolási keretrendszer a DiT-alapú videógeneráló modellek hatékonyságát növeli, különösen az objektumok eltávolításakor.

ArXiv CV·AI
Decentralizált keretrendszerrel erősítené az AI-ba vetett bizalmat a TRUST
Kutatás

Decentralizált keretrendszerrel erősítené az AI-ba vetett bizalmat a TRUST

A központosított AI-ellenőrzési rendszerek robusztussági, skálázhatósági, átláthatósági és adatvédelmi problémáira kínál megoldást az új, decentralizált megközelítés.

ArXiv AI·AI
Javítja a maszkolt diffúziós modellek teljesítményét az önszabályozás
Kutatás

Javítja a maszkolt diffúziós modellek teljesítményét az önszabályozás

A maszkolt diffúziós modellek (MDM) eddig korlátozottan tudták finomítani a még maszkolt pozíciókat, de egy új módszer ezen változtat.

ArXiv ML·AI
A nGPT modell nem skálázódott, a νGPT már átviszi a tanulási rátát
Kutatás

A nGPT modell nem skálázódott, a νGPT már átviszi a tanulási rátát

A Normalized Transformer (nGPT) modell hiába gyorsítja a betanítást, a tanulási ráta átvitele nem működött a modellméretek között, ezt korrigálja az új νGPT.

ArXiv ML·AI
A 2021-es EDEN kvantálási algoritmus veri a 2026-os TurboQuantot
Kutatás

A 2021-es EDEN kvantálási algoritmus veri a 2026-os TurboQuantot

Az EDEN-unbiased változat például egy bittel kevesebb adatot használva is felülmúlja a TurboQuant-prod pontosságát, jelentős hatékonyságnövelést kínálva.

Towards Data Science·AI
Kauzális modellekkel magyarázza a Binary Spiking Neural Networks működését az ArXiv AI
Kutatás

Kauzális modellekkel magyarázza a Binary Spiking Neural Networks működését az ArXiv AI

Egy friss ArXiv AI tanulmány kauzális elemzést nyújt a Binary Spiking Neural Networks működésének megértéséhez. A kutatók a hálózat tüskék aktivitását bináris kauzális modellként reprezentálják.

ArXiv AI·AI
10% neuron eltávolítása is összeomlasztja a specializált LLM-eket — írja az ArXiv
Kutatás

10% neuron eltávolítása is összeomlasztja a specializált LLM-eket — írja az ArXiv

A kutatók matematikai érvelésre és kódgenerálásra specializált nyelvi modelleken vizsgálták a neuronritkítás hatását, megerősítve a feladat-specifikus neuronok létét és kritikus szerepét.

ArXiv NLP·AI

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom