ÉlőUtoljára: 2 órájaMa: 3

Rovat

Kutatás

AI research papers, arXiv publikációk, benchmarkok, tudományos áttörések

804 cikk az archívumban

Matematikusok: ne higgyenek az AI-hype-nak, védi a kutatást a Leideni Nyilatkozat
Kutatás

Matematikusok: ne higgyenek az AI-hype-nak, védi a kutatást a Leideni Nyilatkozat

Az AI-cégek engedély nélkül használják a publikált matematikai kutatásokat, ami veszélyezteti a bizonyítások integritását és az etikai normákat — figyelmeztet a Leideni Nyilatkozat, melyet a Nemzetközi Matematikai Unió is támogat.

TNW·AI
YOLOv9-alapú AI 0.1 pixeles pontossággal méri a részecskéket
Kutatás

YOLOv9-alapú AI 0.1 pixeles pontossággal méri a részecskéket

A kutatásban egy új mélytanulási keretrendszerrel, a DefocusTrackerAI-val érték el a 0.1 pixeles pontosságot. A modell a YOLOv9 objektumdetektáló modellre épül, és szinesztetikus adathalmazon lett betanítva.

ArXiv CV·AI
AI-ügynökök jövője: új tanulmány
Kutatás

AI-ügynökök jövője: új tanulmány

Egy új tanulmány integrálja a világmodellek építészeti, módszertani és alkalmazási irányzatait az emberi intelligenciát megközelítő AI-ügynökök fejlesztéséhez. A kutatás célja, hogy egységes keretrendszert teremtsen a területen belüli sokféle megközelítésnek.

ArXiv ML·AI
Kutatók fejlesztettek egy új ATOM keretrendszert a molekulák optimalizálására
Kutatás

Kutatók fejlesztettek egy új ATOM keretrendszert a molekulák optimalizálására

A kutatók szerint az ATOM keretrendszer hatékonyabban képes kezelni a molekulatervezés során felmerülő ellentétes célokat. Az új módszerrel elérhető jobb Pareto-lefedettség és hipervolumen jelentősen javíthatja a molekulatervezést.

ArXiv AI·AI
AI-alapú orvosi diagnózisok: A legfejlettebb modellek is elbuknak kritikus helyzetekben
Kutatás

AI-alapú orvosi diagnózisok: A legfejlettebb modellek is elbuknak kritikus helyzetekben

A legfejlettebb orvosi LLM-ek is súlyos hibákat véthetnek kritikus klinikai helyzetekben. 11 kortárs LLM-et teszteltek 690 klinikailag megalapozott forgatókönyvön keresztül.

ArXiv NLP·AI
474 játékkal tesztelik az AI-k érvelését: a Stanford és a Google Robotics új benchmarkja
Kutatás

474 játékkal tesztelik az AI-k érvelését: a Stanford és a Google Robotics új benchmarkja

Az új keretrendszer a feladatok szabályait adva arra kényszeríti a modelleket, hogy maguk szerezzenek információt a környezetből, majd ezek alapján hozzanak döntést.

ArXiv AI·AI
Új AI-modell 95%-os pontossággal szegmentálja az agydaganatokat
Kutatás

Új AI-modell 95%-os pontossággal szegmentálja az agydaganatokat

Az új GCSER-UNet modell 95%-os dice score-t ért el az agydaganatok szegmentálásában, ami jelentős előrelépés a korábbi 94%-os csúcshoz képest.

ArXiv CV·AI
ReGuLaR: A vizuális bizonyítékok jobb megértésével javítja az AI-modelleket
Kutatás

ReGuLaR: A vizuális bizonyítékok jobb megértésével javítja az AI-modelleket

A ReGuLaR keretrendszer a vizuális bizonyítékokhoz köti a modell belső érvelését, javítva a pontosságot.

ArXiv CV·AI
LLM-ek torzítása: 1 bangla kutatás
Kutatás

LLM-ek torzítása: 1 bangla kutatás

Egy új bangla nyelvű kutatás kimutatta, hogy az angol nyelvű utasítások a globális narratívákat részesítik előnyben a helyi kontextusokkal szemben a LLM-ekben. A kutatás szerint ez csökkenti a helyi perspektívák lefedettségét.

ArXiv NLP·AI
Calibrated Preference Learning: The Case of Label Ranking
Kutatás

Calibrated Preference Learning: The Case of Label Ranking

A Stanford és a Google kutatói szerint a legtöbb LLM rosszul van kalibrálva rangsorolásnál. Ez befolyásolhatja a megbízhatóságukat.

ArXiv ML·AI
Tökéletes szabálykövetést hoz a DisjunctiveNet neurális hálózat
Kutatás

Tökéletes szabálykövetést hoz a DisjunctiveNet neurális hálózat

A DisjunctiveNet nevű új keretrendszer lehetővé teszi, hogy a neurális hálózatok pontosan betartsák a logikai és lineáris szabályokat, miközben megőrzik a tanulási képességüket.

ArXiv ML·AI
80,37%-os hatékonyságot ért el az új MADQI-módszer a hajózási anomáliák kiszűrésében
Kutatás

80,37%-os hatékonyságot ért el az új MADQI-módszer a hajózási anomáliák kiszűrésében

A tengeri hajózási adatokban előforduló rendellenességek, mint a sebességugrások vagy pozícióeltérések kiszűrésére új minőségi mutatót, a MADQI-t fejlesztették ki. A módszer 80,37%-os hatékonyságot ért el az AIS-adatokon.

ArXiv ML·AI
Hao Zhu: 2 AI-ügynök
Kutatás

Hao Zhu: 2 AI-ügynök

A Stanford-kutatás szerint a két legjobb kódoló AI képességei 50%-ra csökkentek, amikor együttműködtek. A CooperBench tesztben a csapatmunka hátrányosnak bizonyult.

Hetzner: Stanford HAI·AI
MAVEN rendszer 23%-kal javítja az AI-ügynökök általánosítását komplex feladatokon
Kutatás

MAVEN rendszer 23%-kal javítja az AI-ügynökök általánosítását komplex feladatokon

A MAVEN nevű új szimbolikus keretrendszer 23%-kal növeli az AI-ügynökök pontosságát a bonyolult feladatok megoldásában, miközben a számítási költségeket tizedére csökkenti.

ArXiv AI·AI
Új AI-modell gyorsítja a sarkvidéki műholdfelvételek elemzését
Kutatás

Új AI-modell gyorsítja a sarkvidéki műholdfelvételek elemzését

Az új, diverzitás-központú adatkúrával és önfelügyelt tanulással betanított AI-modell 5-8 százalékkal javítja a sarkvidéki infrastruktúra és más objektumok felismerésének pontosságát.

ArXiv CV·AI
CanLegalRAGBench: Evaluating Retrieval-Augmented Generation on Canadian Case Law
Kutatás

CanLegalRAGBench: Evaluating Retrieval-Augmented Generation on Canadian Case Law

A kanadai jogi AI válaszainak 8-29%-a nem támasztható alá. A hibás válaszok aránya a CanLegalRAGBench teszt szerint változó.

ArXiv NLP·AI
Dex2HOI: Új AI-modell szimulál kétkezes, kétobjektumos ember-tárgy interakciókat
Kutatás

Dex2HOI: Új AI-modell szimulál kétkezes, kétobjektumos ember-tárgy interakciókat

A Dex2HOI modell szimulálja az emberi kétkezes, kétobjektumos mozgásokat szöveges leírások alapján. A modell Dual-Stream Diffusion megközelítést használ, amelyben minden tárgy saját interakciós csatornán fut.

ArXiv CV·AI
Berlin kutató 15 szponzort keres AI-biztonsági eszközeihez
Kutatás

Berlin kutató 15 szponzort keres AI-biztonsági eszközeihez

Mahipal Mahipal, berlini AI-biztonsági kutató 15 havi támogatót keres ingyenes, nyílt forráskódú eszközeihez, melyek a kiberbiztonságot hivatottak fejleszteni.

Hetzner: GitHub Trending (AI)·AI
AI-ügynökök buknak a hosszú elemzéseken: 48%-os pontosság az új teszten
Kutatás

AI-ügynökök buknak a hosszú elemzéseken: 48%-os pontosság az új teszten

A legjobb modellek is csak 48,45%-os pontossággal teljesítenek a LongDS nevű új teljesítményteszten, amely az iteratív, hosszú távú adatelemzési feladatokat vizsgálja.

ArXiv ML·AI
Új AI-módszerrel szimulálják az agyi aktivitást — wavelet és DCT transzformációkkal
Kutatás

Új AI-módszerrel szimulálják az agyi aktivitást — wavelet és DCT transzformációkkal

A Dual-Spectral Flow Matching (DSFM) keretrendszer wavelet és diszkrét koszinusz transzformációt (DCT) használ az agyi aktivitás szimulálásához, javítva a diagnosztikát.

ArXiv ML·AI
PhyDrawGen: Fizikai pontossággal rajzolja le a tudományos problémákat az AI
Kutatás

PhyDrawGen: Fizikai pontossággal rajzolja le a tudományos problémákat az AI

A fizikai törvényeket betartó tudományos ábrákat generáló PhyDrawGen neuro-szimbolikus AI-folyamat képes a hibátlan geometriai és fizikai pontosságra, szemben a korábbi modellekkel.

ArXiv AI·AI

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom