ÉlőUtoljára: 27 perceMa: 18

Rovat · 9. oldal

Kutatás

AI research papers, arXiv publikációk, benchmarkok, tudományos áttörések

811 cikk az archívumban

Az emberi kommunikáció inkább „mohó” mint optimális — állítja az ArXiv tanulmánya
Kutatás

Az emberi kommunikáció inkább „mohó” mint optimális — állítja az ArXiv tanulmánya

A tanulmányban a kutatók azt vizsgálták, hogyan reagálnak az emberek különböző kérdésekre, ha szókincsüket akár 250 gyakori szóra korlátozzák.

ArXiv NLP·AI
Ghánai joghallgatókat segít az Eskwai for Students AI — 32 ezer lekérdezést kezeltek
Kutatás

Ghánai joghallgatókat segít az Eskwai for Students AI — 32 ezer lekérdezést kezeltek

Az Eskwai for Students nevű generatív AI-asszisztens 12 ezer esetjog és 1400 jogszabály alapján válaszol jogi kérdésekre, ezzel segítve a ghánai joghallgatókat.

ArXiv NLP·AI
OP-Mix: új adatmixelő algoritmus egységesíti a nyelvi modellek betanítását
Kutatás

OP-Mix: új adatmixelő algoritmus egységesíti a nyelvi modellek betanítását

Az új megközelítés a jelölt adatmixeket olcsón szimulálja alacsony rangú adapterek interpolálásával, amelyeket közvetlenül betanítottak.

ArXiv NLP·AI
RAG-alapú rendszer gyorsítja a nővér-beteg beszélgetések elemzését
Kutatás

RAG-alapú rendszer gyorsítja a nővér-beteg beszélgetések elemzését

A klinikai adatok strukturálása eddig időigényes feladat volt, de egy moduláris RAG-folyamat most jelentősen egyszerűsíti a nővér-beteg párbeszédek elemzését.

ArXiv NLP·AI
MR2-ByteTrack: új videóobjektum-észlelési módszer CNN és Transformer alapokon
Kutatás

MR2-ByteTrack: új videóobjektum-észlelési módszer CNN és Transformer alapokon

A rendszer a felbontások váltogatásával és egy új Rescore algoritmussal optimalizálja a teljesítményt, miközben a pontosságot fenntartja.

ArXiv CV·AI
Új Social-Mamba modell a tömeges környezetekben való navigációhoz
Kutatás

Új Social-Mamba modell a tömeges környezetekben való navigációhoz

Az új architektúra a szociális interakciókat strukturált szekvenciális folyamatokként értelmezi újra, ami jelentősen növeli a számítási hatékonyságot.

ArXiv CV·AI
Új ChangeFlow modell javítja a távérzékeléses változásdetekciót
Kutatás

Új ChangeFlow modell javítja a távérzékeléses változásdetekciót

A távérzékeléses változásdetekció (RSCD) célja, hogy azonosítsa a földrajzi régiók két képe közötti különbségeket, ám a hagyományos módszerek gyakran pontatlanok.

ArXiv CV·AI
A 3-bites kvantálás 21%-kal növeli a LLM-ek elfogultságát
Kutatás

A 3-bites kvantálás 21%-kal növeli a LLM-ek elfogultságát

A kvantálás célja a LLM-ek költségeinek és memóriaterületének csökkentése, de egy új tanulmány rávilágít, hogy ez a folyamat jelentős minőségi kompromisszumokkal járhat az elfogultság terén.

ArXiv ML·AI
Hardverre optimalizálja a LLM-dekódolást a GQLA – H100 és H20 GPU-kon is gyorsabb
Kutatás

Hardverre optimalizálja a LLM-dekódolást a GQLA – H100 és H20 GPU-kon is gyorsabb

A Group-Query Latent Attention (GQLA) minimális módosítással két, algebrailag ekvivalens dekódolási utat tesz elérhetővé ugyanazokon a paramétereken, újraoktatás nélkül.

ArXiv ML·AI
Új Conditional Attribute Transformers: ezerszer gyorsabban becsüli az attribútumokat
Kutatás

Új Conditional Attribute Transformers: ezerszer gyorsabban becsüli az attribútumokat

A Conditional Attribute Transformers (CAT) módszerrel a generatív modellek sokkal gyorsabban becsülhetik meg a szekvencia szintű attribútumokat, mint a korábbi mintavételi eljárások.

ArXiv AI·AI
1,7-szeres gyorsulást hoz a Lighthouse Attention a hosszú kontextusú LLM-ek betanításában
Kutatás

1,7-szeres gyorsulást hoz a Lighthouse Attention a hosszú kontextusú LLM-ek betanításában

A Lighthouse Attention a betanítási időt csökkenti, miközben a modellek végső betanítási veszteségét változatlanul hagyja, vagy akár javítja is.

MarkTechPost·AI
PolitNuggets: 400 politikus életrajzával teszteli az AI-ügynökök ténygyűjtését
Kutatás

PolitNuggets: 400 politikus életrajzával teszteli az AI-ügynökök ténygyűjtését

A PolitNuggets egy többnyelvű rendszer, amely 400 globális elit politikus életrajzának összeállításával értékeli az AI-ügynökök információszintézisét.

ArXiv AI·AI
GraphBit: Gráfalapú rendszerrel szünteti meg a LLM-ek hibás útválasztását
Kutatás

GraphBit: Gráfalapú rendszerrel szünteti meg a LLM-ek hibás útválasztását

A rendszer a nagyméretű nyelvi modellek (LLM) által vezérelt munkafolyamatokban gyakori hallucinált útválasztást és végtelen ciklusokat előzi meg, növelve a megbízhatóságot.

ArXiv AI·AI
Diffúziós nyelvi modelleket javít a TraFL — minden teljesítményteszten felülmúlja az alapmodellt
Kutatás

Diffúziós nyelvi modelleket javít a TraFL — minden teljesítményteszten felülmúlja az alapmodellt

A TraFL (Trajectory Flow baLancing) nevű új eljárás a diffúziós nyelvi modellek poszt-betanítási fázisában jelentkező „pályazár” problémát orvosolja, amely a megoldások szűk körére koncentrálja a modellt.

ArXiv ML·AI
Pontosabb alaprajzokat készít az új AI — betartja a méretkorlátokat
Kutatás

Pontosabb alaprajzokat készít az új AI — betartja a méretkorlátokat

A jelenlegi alaprajz-generáló AI-k főleg a helyiségek kapcsolódására fókuszálnak, de az új megközelítés már a pontos méreteket és területeket is képes kezelni.

ArXiv NLP·AI
Többnyelvű AI-modellek tudásszerkesztését javítja egy új vektorösszegzési módszer
Kutatás

Többnyelvű AI-modellek tudásszerkesztését javítja egy új vektorösszegzési módszer

A nagyméretű nyelvi modellek (LLM) többnyelvű tudásszerkesztése (MKE) eddig komoly kihívást jelentett a nyelvi specifikus szerkesztések interferenciája miatt.

ArXiv NLP·AI
A LLM-ügynökök önismeretét és érzelmeit javítja egy új GraphRAG-módszer
Kutatás

A LLM-ügynökök önismeretét és érzelmeit javítja egy új GraphRAG-módszer

Az új megközelítés a Maslow-piramis és Plutchik érzelemkereke alapján értékeli az elvárt viselkedéseket, ezzel mélyebb önismeretet és dilemmamegoldó képességet biztosítva az AI-nak.

ArXiv AI·AI
LLM-desztilláció teljes energiaigényét méri a ComRAM — új mérési módszerrel
Kutatás

LLM-desztilláció teljes energiaigényét méri a ComRAM — új mérési módszerrel

A kutatók részletes, szakaszokra bontott GPU-energiafogyasztás-követéssel vizsgálták a logit-alapú tudásdesztilláció és a szintetikus adatokkal történő finomhangolás energia- és kibocsátási adatait.

ArXiv ML·AI
ProtoMedAgent: Új rendszerrel zárja ki a klinikai AI-hallucinációt az ArXiv kutatása
Kutatás

ProtoMedAgent: Új rendszerrel zárja ki a klinikai AI-hallucinációt az ArXiv kutatása

A ProtoMedAgent rendszer az orvosi dokumentációban gyakori „retrieval sycophancy” jelenséget küszöböli ki, ahol a nyelvi modellek téves magyarázatokat generálnak a vizuális előrejelzésekhez.

ArXiv CV·AI
Költséghatékony génexpressziós előrejelzést ígér a DUET a hisztológiai képekből
Kutatás

Költséghatékony génexpressziós előrejelzést ígér a DUET a hisztológiai képekből

A DUET nevű új módszer két paradigmát ötvözve kínál megoldást a meglévő rendszerek korlátaira, amelyek a vizuális hasonlóságra építenek, de nem garantálják a molekuláris konzisztenciát.

ArXiv CV·AI
Új geometriai modell tisztázza a súlyozott kontrasztív tanulás működését
Kutatás

Új geometriai modell tisztázza a súlyozott kontrasztív tanulás működését

A súlyozási séma határozza meg, hogy a kontrasztív tanulás geometriailag megvalósítható, degenerált vagy inkonzisztens lesz-e, ami elvi alapot ad új célfüggvények tervezéséhez.

ArXiv ML·AI

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom