ÉlőUtoljára: 1 órájaMa: 23

Rovat · 27. oldal

Kutatás

AI research papers, arXiv publikációk, benchmarkok, tudományos áttörések

813 cikk az archívumban

A HY-World 2.0 szövegből és képekből épít valósághű 3D világokat
Kutatás

A HY-World 2.0 szövegből és képekből épít valósághű 3D világokat

A HY-World 2.0 nemcsak létrehozza, hanem rekonstruálja és szimulálja is a 3D környezeteket, ami kulcsfontosságú lehet a robotika és a játékfejlesztés számára.

ArXiv CV·AI
MixAtlas: 100-szor olcsóbban optimalizálja a többmodális AI-t az Apple kutatása
Kutatás

MixAtlas: 100-szor olcsóbban optimalizálja a többmodális AI-t az Apple kutatása

A MixAtlas nevű keretrendszerrel a többmodális nagyméretű nyelvi modellek (LLM) betanítása drasztikusan felgyorsulhat, miközben a költségek töredékére csökkennek.

Apple ML·AI
Új AI-ügynökök automatizálják a félvezető hibaelemzést, egy perc alatt kész a jelentés
Kutatás

Új AI-ügynökök automatizálják a félvezető hibaelemzést, egy perc alatt kész a jelentés

A félvezetőgyártásban eddig órákat emésztett fel a hibaelemzés, most egy új, ügynök-alapú AI-keretrendszer akár egy perc alatt képes strukturált jelentéseket készíteni.

ArXiv CV·AI
Új AI-keretrendszer értékeli a drónképek minőségét: 0,830 SRCC pontszámot ért el
Kutatás

Új AI-keretrendszer értékeli a drónképek minőségét: 0,830 SRCC pontszámot ért el

Egy új, könnyű, több metrikát használó AI-keretrendszer, a MM-IQA, referencia kép nélkül is képes értékelni a drónok által készített felvételek minőségét, 0,647 és 0,830 közötti SRCC értékeket érve el.

ArXiv CV·AI
A Llama-3.1-8B a Mistralt és a Qwen3-at is veri nepáli nyelven
Kutatás

A Llama-3.1-8B a Mistralt és a Qwen3-at is veri nepáli nyelven

A Llama-3.1-8B modell jobban alkalmazkodik a romanizált nepáli nyelvhez, mint a Mistral-7B-v0.1 és a Qwen3-8B, különösen finomhangolás után.

ArXiv NLP·AI
Új kutatás térképezi fel a XAI és a szimulációs modellek kapcsolatát
Kutatás

Új kutatás térképezi fel a XAI és a szimulációs modellek kapcsolatát

A komplex rendszerek szimulációja egyre inkább átláthatatlan „fekete doboz” számítógépes szimulátorokra támaszkodik, amelyek működését nehéz megérteni.

ArXiv AI·AI
Új finomhangolási módszerrel javulhat a Qwen3-8B érvelési képessége
Kutatás

Új finomhangolási módszerrel javulhat a Qwen3-8B érvelési képessége

A mesterséges intelligencia modellek finomhangolása során gyakran romlik a teljesítmény, ha a tanító modell stílusa eltér a tanulóétól, de egy új módszer orvosolhatja ezt a problémát.

ArXiv NLP·AI
MemGround: Új teljesítményteszt méri a LLM-ek hosszú távú memóriáját gamifikált környezetben
Kutatás

MemGround: Új teljesítményteszt méri a LLM-ek hosszú távú memóriáját gamifikált környezetben

A MemGround nevű új értékelőkészlet a nyelvi modellek (LLM) hosszú távú memóriáját vizsgálja dinamikus, gamifikált környezetben, szakítva a statikus tesztelési módszerekkel.

ArXiv NLP·AI
Új mesterséges intelligencia-módszer fejlesztése a kiberfenyegetések elleni védelem javítására
Kutatás

Új mesterséges intelligencia-módszer fejlesztése a kiberfenyegetések elleni védelem javítására

A H-TechniqueRAG nevű új keretrendszer a MITRE ATT&CK taxonómiáját használja fel, hogy hatékonyabban térképezze fel a kiberfenyegetéseket.

ArXiv NLP·AI
Koreai multimodális teljesítményteszten bukik az AI: 42%-os pontosság a legjobb nyílt modell
Kutatás

Koreai multimodális teljesítményteszten bukik az AI: 42%-os pontosság a legjobb nyílt modell

A KMMMU teljesítményteszten a legerősebb nyílt forráskódú AI-modellek 42%-os pontosságot értek el. A teszt a koreai nyelvre és kultúrára szabott, multimodális megértési képességet méri fel.

ArXiv NLP·AI
Új AI-módszer garantálja a költséghatékony biztonsági felügyeletet
Kutatás

Új AI-módszer garantálja a költséghatékony biztonsági felügyeletet

A Calibrate-Then-Delegate (CTD) nevű megközelítés költséghatékonyabbá teszi a nagyméretű nyelvi modellek (LLM) biztonsági ellenőrzését, miközben garantálja a számítási költségeket.

ArXiv ML·AI
MAPCA: Egységes módszer a skála-invariáns reprezentációkhoz, folyamatos spektrális kontrollal
Kutatás

MAPCA: Egységes módszer a skála-invariáns reprezentációkhoz, folyamatos spektrális kontrollal

A Metric-Aware Principal Component Analysis (MAPCA) névre keresztelt módszer a skálaérzékenység problémáját orvosolja a gépi tanulásban, ami eddig torzíthatta az adatok értelmezését.

ArXiv ML·AI
Új AI-módszer felezi a betanítási költségeket: 50-80%-kal kevesebb frissítés kell
Kutatás

Új AI-módszer felezi a betanítási költségeket: 50-80%-kal kevesebb frissítés kell

A mesterséges intelligencia betanítását forradalmasíthatja egy új, biológiailag inspirált módszer, amely a hibákra fókuszálva optimalizálja a szinaptikus frissítéseket.

ArXiv AI·AI
Új AI-keretrendszer csökkenti a kognitív kockázatokat a nukleáris erőművekben
Kutatás

Új AI-keretrendszer csökkenti a kognitív kockázatokat a nukleáris erőművekben

A nukleáris erőművek digitalizált vezérlőtermei új kihívásokat és megnövekedett kognitív kockázatokat hoztak, amelyeket a hagyományos emberi megbízhatósági elemzések nem kezelnek megfelelően.

ArXiv AI·AI
DharmaOCR: Új SSLM-ek ígérnek jobb OCR-t és alacsonyabb költségeket
Kutatás

DharmaOCR: Új SSLM-ek ígérnek jobb OCR-t és alacsonyabb költségeket

A DharmaOCR Full és Lite modellek a strukturált optikai karakterfelismerés (OCR) területén ígérnek jelentős előrelépést, miközben a generálás stabilitását és a számítási költségeket is optimalizálják.

ArXiv CV·AI
CRUX: AI-ügynök két hibával publikált iOS appot az App Store-ba
Kutatás

CRUX: AI-ügynök két hibával publikált iOS appot az App Store-ba

A CRUX, egy 17 kutatóból álló együttműködés, új, valós világú értékelési módszert vezet be a határ-AI képességek mérésére, miután egy AI-ügynök sikeresen publikált egy iOS alkalmazást.

AI Snake Oil·AI
Új AI-architektúra csökkenti a LLM-ek hibáit: 62%-kal kevesebb ismétlődés
Kutatás

Új AI-architektúra csökkenti a LLM-ek hibáit: 62%-kal kevesebb ismétlődés

A több lépésből álló feladatoknál a LLM-ek akár 30%-os arányban is szenvednek a hibás érveléstől, ismétlődésektől vagy elakadásoktól.

ArXiv AI·AI
Új STOMP algoritmus oldja meg a többcélú AI-tanulás nehézségeit
Kutatás

Új STOMP algoritmus oldja meg a többcélú AI-tanulás nehézségeit

A STOMP nevű új offline megerősítéses tanulási algoritmus a konfliktusos célok egyidejű optimalizálására kínál megoldást, ami korábban kihívást jelentett az AI-rendszerek számára.

ArXiv ML·AI
WorkRB: 13 munkaerőpiaci feladatot egységesít az új nyílt forráskódú teljesítményteszt
Kutatás

WorkRB: 13 munkaerőpiaci feladatot egységesít az új nyílt forráskódú teljesítményteszt

A munkaerőpiaci AI-kutatás eddig rendkívül széttagolt volt, ami megnehezítette a különböző rendszerek összehasonlítását és reprodukálhatóságát.

ArXiv NLP·AI
A METR diagramja lett az AI-ipar új Moore-törvénye
Kutatás

A METR diagramja lett az AI-ipar új Moore-törvénye

A METR nevű, 30 fős nonprofit AI-szervezet által készített diagram az iparágban az AI-rendszerek gyors fejlődésének kulcsfontosságú mérőszámává vált.

NYT Technology·AI
LLM-ek buktatják le a gépi tanulás módszertani hibáit: adatszivárgást találtak
Kutatás

LLM-ek buktatják le a gépi tanulás módszertani hibáit: adatszivárgást találtak

A gépi tanulási kutatások megbízható értékelése kulcsfontosságú, de a módszertani hibák, különösen az adatszivárgás, gyakran aláássák a közölt eredmények érvényességét.

ArXiv NLP·AI

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom