ÉlőUtoljára: 1 órájaMa: 25

Rovat · 16. oldal

Kutatás

AI research papers, arXiv publikációk, benchmarkok, tudományos áttörések

813 cikk az archívumban

MuCALD-SplitFed: Jobb orvosi képalkotás és adatvédelem a szegmentálásban
Kutatás

MuCALD-SplitFed: Jobb orvosi képalkotás és adatvédelem a szegmentálásban

A hagyományos elosztott tanulási módszerek gyakran instabilak és sérülékenyek az orvosi képalkotásban, de az új MuCALD-SplitFed rendszer stabilabb és adatvédelmi szempontból is biztonságosabb megoldást kínál.

ArXiv CV·AI
Claude belső gondolatait olvassa az Anthropic új NLA rendszere
Kutatás

Claude belső gondolatait olvassa az Anthropic új NLA rendszere

Az Anthropic kutatói egy olyan módszert fejlesztettek ki, amely Claude mesterséges intelligencia modelljének belső „gondolatait” – az úgynevezett aktivációkat – képes természetes nyelvi szöveggé alakítani.

Hacker News·AI
17-szeres javulást hoz az indiai beszédfelismerésben egy új TTS-STT módszer
Kutatás

17-szeres javulást hoz az indiai beszédfelismerésben egy új TTS-STT módszer

A digitális számok, pénznemek, címek és márkanevek felismerése eddig gyenge pontja volt az indiai nyelvek beszédfelismerő rendszereinek, most egy új megközelítés 17-szeres javulást ígér.

ArXiv NLP·AI
Új APMPO rendszerrel javul a LLM-ek érvelési képessége – dinamikus optimalizálás érkezik
Kutatás

Új APMPO rendszerrel javul a LLM-ek érvelési képessége – dinamikus optimalizálás érkezik

Az Adaptive Power-Mean Policy Optimization (APMPO) a Reinforcement Learning with Verifiable Rewards (RLVR) keretrendszerre épül, de a statikus optimalizálási sémák korlátait hivatott feloldani.

ArXiv NLP·AI
Kauzális elemzéssel szűri ki a regionális elfogultságot az új LLM-módszer
Kutatás

Kauzális elemzéssel szűri ki a regionális elfogultságot az új LLM-módszer

A jelenlegi elfogultság-értékelések zavaróak, mert a tesztadatkészletekben a demográfiai csoportokhoz természetesen társuló témák inherens toxicitása eltorzítja az eredményeket.

ArXiv AI·AI
Új módszerrel gyorsulhat a multimodális MoE LLM-ek következtetése
Kutatás

Új módszerrel gyorsulhat a multimodális MoE LLM-ek következtetése

A Mixture-of-Experts Multimodális Nagy Nyelvi Modellek (MoE MLLM-ek) eddig jelentős hatékonysági problémákkal küzdöttek a következtetés során, de egy új módszer orvosolhatja a problémát.

ArXiv ML·AI
Az Apple Velox rendszere 4D-s objektumok geometriáját és megjelenését is rögzíti
Kutatás

Az Apple Velox rendszere 4D-s objektumok geometriáját és megjelenését is rögzíti

A Velox egy kódolót használ a téridőbeli színes pontfelhők dinamikus alakzat tokenekké történő tömörítésére, minimális bemeneti adattal dolgozva.

Apple ML·AI
Kis nyelvi modellek: 13 százalékponttal javult a Bash-parancsok generálása
Kutatás

Kis nyelvi modellek: 13 százalékponttal javult a Bash-parancsok generálása

A kis nyelvi modellek Bash parancsok generálásának megbízhatósága átlagosan 13 százalékponttal javult. A sikerességi arány 62,5%-ról 75,2%-ra nőtt.

Nvidia Developer·AI
A RVPO 0.261-re javítja a HealthBench pontszámát, elkerülve a „kényszerelhanyagolást”
Kutatás

A RVPO 0.261-re javítja a HealthBench pontszámát, elkerülve a „kényszerelhanyagolást”

A jelenlegi RLHF-módszerek gyengesége, hogy az átlagolás miatt figyelmen kívül hagyhatják a kritikus biztonsági vagy formázási korlátokat, ezt orvosolja az új megközelítés.

Apple ML·AI
Tízezer fejről tanult az Apple és az ETH Zürich 3D-s HeadsUp modellje
Kutatás

Tízezer fejről tanult az Apple és az ETH Zürich 3D-s HeadsUp modellje

Az új technológia a többkamerás felvételeket hatékonyan tömöríti, majd UV-paraméterezett 3D Gauss-eloszlásokká alakítja, ami nagy felbontású bemeneti adatok feldolgozását teszi lehetővé.

Apple ML·AI
MidSteer: Új affin keretrendszerrel optimalizálják a generatív modellek irányítását
Kutatás

MidSteer: Új affin keretrendszerrel optimalizálják a generatív modellek irányítását

Az új módszer a koncepciók affin törlését és váltását formalizálja, ezzel pontosabb és célzottabb kontrollt biztosítva a mesterséges intelligencia rendszerek felett.

ArXiv ML·AI
Párhuzamos előtag-ellenőrzéssel gyorsítja a LLM-eket a PARSE rendszer
Kutatás

Párhuzamos előtag-ellenőrzéssel gyorsítja a LLM-eket a PARSE rendszer

A jelenlegi spekulatív dekódolási módszerek korlátait áthidalva a PARSE a szemantikai szinten párhuzamosítja az előtagok ellenőrzését, ezzel jelentősen növelve a feldolgozási sebességet.

ArXiv AI·AI
Az AI-modellek 'alignment' tesztjei nem jósolják meg a valós viselkedést
Kutatás

Az AI-modellek 'alignment' tesztjei nem jósolják meg a valós viselkedést

A mesterséges intelligencia modellek 'alignment' értékelése, amely jellemzően fix bemenetekre adott kimeneteket vizsgál, nem elegendő a valós, éles környezetben történő viselkedés megítéléséhez.

ArXiv AI·AI
Új módszerrel javítja a LLM-ek általánosítási képességét az ADAPT
Kutatás

Új módszerrel javítja a LLM-ek általánosítási képességét az ADAPT

Az új megközelítés a hagyományos offline adatválogatással szemben valós időben, a betanítás során módosítja a minták fontosságát, így növeli a modellek alkalmazkodóképességét.

ArXiv ML·AI
Új Lookahead Drifting modell javítja a képgenerálást — egy lépésben ér el SOTA-t
Kutatás

Új Lookahead Drifting modell javítja a képgenerálást — egy lépésben ér el SOTA-t

A modell a korábbi egy lépéses módszerekkel szemben több, egymást követő "drifting" kifejezést számol ki a betanítás során, ezzel hatékonyabban igazítva a kimenetet a kívánt eredményekhez.

ArXiv ML·AI
80-szor gyorsabbá teszi a 3D pontfelhő anomáliadetektálást az új modell
Kutatás

80-szor gyorsabbá teszi a 3D pontfelhő anomáliadetektálást az új modell

A jelenlegi diffúziós modellek lassúságát kiküszöbölve a gyártási folyamatokban kritikus, valós idejű hibafelismerés is lehetővé válhat a jövőben.

ArXiv CV·AI
215 ezer példával tanítja a nyelvi modelleket a társalgás időzítésére a When2Speak
Kutatás

215 ezer példával tanítja a nyelvi modelleket a társalgás időzítésére a When2Speak

A jelenlegi nagyméretű nyelvi modellek (LLM) gyengén teljesítenek a több résztvevős beszélgetések megfelelő időzítésében, ami zavaró megszakításokhoz vezet.

ArXiv NLP·AI
A késői rétegek rontják a nyílt LLM-ek tagadáskezelését — belsőleg mégis értik
Kutatás

A késői rétegek rontják a nyílt LLM-ek tagadáskezelését — belsőleg mégis értik

A nyílt forráskódú nyelvi modellek gyakran hibáznak a tagadó kérdésekre adott válaszoknál, noha belsőleg képesek lennének a helyes feldolgozásra.

ArXiv NLP·AI
MetaAdamW: önszabályozó optimalizálóval javul a mélytanulási modellek betanítása
Kutatás

MetaAdamW: önszabályozó optimalizálóval javul a mélytanulási modellek betanítása

A MetaAdamW a hagyományos adaptív optimalizálókkal ellentétben rétegenként és modulonként eltérő hiperparamétereket alkalmaz, ezzel finomhangolva a betanítási folyamatot.

ArXiv ML·AI
Dinamikus ranglistán méri az AI-modelleket az Agent Island — elkerüli a teljesítményteszt-telítettséget
Kutatás

Dinamikus ranglistán méri az AI-modelleket az Agent Island — elkerüli a teljesítményteszt-telítettséget

A hagyományos, statikus teljesítménytesztek telítődése és szennyeződése miatt nehéz nyomon követni az AI-modellek fejlődését, ezen a problémán segíthet az Agent Island.

ArXiv AI·AI
Az Apple TC-JEPA rendszere szöveggel javítja a vizuális AI-modellek pontosságát
Kutatás

Az Apple TC-JEPA rendszere szöveggel javítja a vizuális AI-modellek pontosságát

A Text-Conditional JEPA (TC-JEPA) a képaláírások felhasználásával pontosabbá teszi a maszkolt képrészletek előrejelzését, ami stabilabb betanítást eredményez.

Apple ML·AI

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom