Rovat · 23. oldal

Kutatás

AI research papers, arXiv publikációk, benchmarkok, tudományos áttörések

1159 cikk az archívumban

Két nagyságrenddel gyorsítja a képleírások értékelését a BEiTScore

A modell a nagyméretű nyelvi modellek (LLM) alapú értékelés számításigényét mérsékli, miközben a finomhangolt érzékenységet megőrzi.

ArXiv CV·2 hónapjaAI

Kutatás

31%-kal több MRI-adatot tesz elemezhetővé egy új AI-modell

A mozgásos műtermékek eddig jelentős adatvesztést okoztak a nagy felbontású MRI-vizsgálatoknál, de a MRecover most 31,8%-kal több elemezhető adatot biztosít.

ArXiv CV·2 hónapjaAI

Kutatás

LLM-ek előzik a finomhangolt modelleket az öngyilkossági adatok elemzésében

Az öngyilkosságot megelőző körülmények feltárásához elengedhetetlen a strukturált információk kinyerése a haláleseti vizsgálati beszámolókból, amihez gyakran szemantikai következtetésre van szükség.

ArXiv NLP·2 hónapjaAI

Kutatás

99%-kal csökkenti az AI modellek skálázási költségét a Stanford új módszere

A pszichometriából és oktatásmérésből kölcsönzött statisztikai elvekkel 99%-kal kevesebb számítási kapacitás is elegendő a nagy nyelvi modellek jövőbeli teljesítményének előrejelzésére.

Hetzner: Stanford HAI·2 hónapjaAI

Kutatás

WildRoadBench: Drónfelvételekkel teszteli az AI-t az úthibák felismerésében

A WildRoadBench egy professzionálisan annotált drónkorpuszon keresztül vizsgálja a látás-nyelvi modellek (VLM) és az LLM-vezérelt autonóm ügynökök képességeit.

ArXiv CV·2 hónapjaAI

Kutatás

Maori szövegfelolvasó modellt fejlesztettek Új-Zélandon — a közösségé a tulajdonjog

A Waikato Egyetem új modellje a maori nyelv egyedi dialektusaira fókuszál, és a közösségi tulajdonjogot hangsúlyozza, szemben a nagy technológiai cégek adatgyűjtési gyakorlatával.

IEEE Spectrum AI·2 hónapjaAI

Kutatás

Feltételes optimizmussal fogadják az AI-t a nyelvi hozzáférés menedzserek

Az amerikai egészségügyben, bíróságokon és közszolgáltatásokban dolgozó tíz menedzser bevonásával készült felmérés rávilágít az AI-val kapcsolatos vegyes érzésekre.

ArXiv NLP·2 hónapjaAI

Kutatás

55% alatt teljesítenek a bíróként használt LLM-ek — megbízhatatlan az értékelésük

A jelenlegi LLM-bírók megbízhatósága alacsony, a legjobb modellek is 55% alatti pontosságot érnek el az érvelés, eszközhasználat és jelentésminőség értékelésében.

ArXiv NLP·2 hónapjaAI

Kutatás

Minden komoly AI-ügynöknek saját számítógép kell a The Sequence szerint

A mesterséges intelligencia ügynökök fejlődését nem csak a fejlettebb modellek vagy API-k, hanem a számítógéphez való hozzáférés határozza meg — állítja a The Sequence Opinion.

TheSequence·2 hónapjaAI

Kutatás

ANNEAL: öngyógyító AI-ügynök javítja a hibás folyamatismeretet

A rendszer a folyamatismereti gráfot frissíti, így az ügynökök nem követik el újra ugyanazokat a hibákat, növelve a megbízhatóságot.

ArXiv AI·2 hónapjaAI

Kutatás

Mirage: Akár 15,4 ponttal is felülmúlja a felejtési teszteket az új audit keretrendszer

A rendszer négy diagnosztikai eszközzel — Linear Probe Recovery (LPR), Centered Kernel Alignment (CKA), Feature Separability Scoring és Layer-Wise Recovery Analysis — teszi próbára a modelleket.

ArXiv CV·2 hónapjaAI

Kutatás

Új AI rendszer forradalmasítja az ökológiai megfigyelést — kevesebb energiát fogyaszt

A hagyományos felmérések erőforrás-igényesek, az új élvonalbeli AI-megoldás viszont a tudásadaptációra fókuszál a modelladaptáció helyett, így a távoli helyszíneken is hatékonyan működik.

ArXiv AI·2 hónapjaAI

Kutatás

Webes AI-ügynökök sebességét növeli a Skim spekulatív végrehajtási rendszer

A rendszer a weboldalak stabil URL-mintáit és válaszformátumait használja ki, így a legtöbb lekérdezésnél elkerülhető a költséges modell-inferencia és böngésző-renderelés.

ArXiv AI·2 hónapjaAI

Kutatás

Emberibb párbeszédeket ígér a Moshi modell: valós idejű szinkronizációt mértek

Az emberi kommunikációhoz hasonlóan egyszerre hallgató és beszélő AI-modellek belső működését elemezték, ami zajmentes környezetben erős szinkronizációt mutatott.

ArXiv NLP·2 hónapjaAI

Kutatás

A Graph Transductive Sharpening javítja a csomópont-osztályozást címkézetlen adatokkal

A transzduktív beállításban a teljes gráf megfigyelhető, de a csomópontok címkéi csak részben állnak rendelkezésre, ami korlátozza a betanítási adatokat.

ArXiv ML·2 hónapjaAI

Kutatás

TabPFN-MT: 344 adatkészleten is felülmúlja a táblázatos többcélú tanulás eddigi csúcsát

A modell egy kiterjesztett y-kódolót és egy megosztott dekóderfejet használ a többcélú in-context tanulás és a szimultán következtetés lehetővé tételére.

ArXiv ML·2 hónapjaAI

Kutatás

Kutatók: látens spektrum irányítja

Egy új tanulmány szerint a valós adatok skálázási törvényeit egy látens prediktív hozzájárulási spektrum progresszív lefedése határozza meg, nem csupán a token-gyakoriság. A kutatók ezt szövegkorpuszok elemzésével bizonyították.

ArXiv NLP·2 hónapjaAI

Kutatás

Új SDM módszer növeli a modell-robusztusság értékelésének hatékonyságát

A Sequential Difference Maximization (SDM) néven bemutatott új megközelítés a korábbi APGD-módszerek óta stagnáló területen hoz áttörést, új optimalizálási célkitűzéssel.

ArXiv CV·2 hónapjaAI

Kutatás

HELLoRA: Új módszer a nagy nyelvi modellek hatékony finomhangolására

A Hot-Experts Layer-level Low-Rank Adaptation (HELLoRA) csak a leggyakrabban aktivált szakértőkhöz csatol LoRA modulokat, ezzel jelentősen optimalizálva a betanítást.

ArXiv ML·2 hónapjaAI

Kutatás

ArXiv: Új Learn-by-Wire Guard technológia javítja a nyelvmodellek stabilitását

A rendszer a modern nyelvi modellek (LLM) betanítási instabilitását célozza, amely agresszív tanulási ráták és skálázás mellett gyakran jelentkezik.

ArXiv AI·2 hónapjaAI

Kutatás

ReCrit: Új RL-modell védi a tudományos válaszokat a káros kritikától

A modell a kritikai interakciót átmeneti problémaként kezeli, nem pedig a végső válasz pontosságaként, ezzel kiküszöbölve a szikofancia kockázatát.

ArXiv ML·2 hónapjaAI