Rovat · 26. oldal

Kutatás

AI research papers, arXiv publikációk, benchmarkok, tudományos áttörések

1159 cikk az archívumban

Új ChangeFlow modell javítja a távérzékeléses változásdetekciót

A távérzékeléses változásdetekció (RSCD) célja, hogy azonosítsa a földrajzi régiók két képe közötti különbségeket, ám a hagyományos módszerek gyakran pontatlanok.

ArXiv CV·2 hónapjaAI

Kutatás

A 3-bites kvantálás 21%-kal növeli az LLM-ek elfogultságát

A kvantálás célja az LLM-ek költségeinek és memóriaterületének csökkentése, de egy új tanulmány rávilágít, hogy ez a folyamat jelentős minőségi kompromisszumokkal járhat az elfogultság terén.

ArXiv ML·2 hónapjaAI

Kutatás

Hardverre optimalizálja az LLM-dekódolást a GQLA – H100 és H20 GPU-kon is gyorsabb

A Group-Query Latent Attention (GQLA) minimális módosítással két, algebrailag ekvivalens dekódolási utat tesz elérhetővé ugyanazokon a paramétereken, újraoktatás nélkül.

ArXiv ML·2 hónapjaAI

Kutatás

Új Conditional Attribute Transformers: ezerszer gyorsabban becsüli az attribútumokat

A Conditional Attribute Transformers (CAT) módszerrel a generatív modellek sokkal gyorsabban becsülhetik meg a szekvencia szintű attribútumokat, mint a korábbi mintavételi eljárások.

ArXiv AI·2 hónapjaAI

Kutatás

1,7-szeres gyorsulást hoz a Lighthouse Attention a hosszú kontextusú LLM-ek betanításában

A Lighthouse Attention a betanítási időt csökkenti, miközben a modellek végső betanítási veszteségét változatlanul hagyja, vagy akár javítja is.

MarkTechPost·2 hónapjaAI

Kutatás

PolitNuggets: 400 politikus életrajzával teszteli az AI-ügynökök ténygyűjtését

A PolitNuggets egy többnyelvű rendszer, amely 400 globális elit politikus életrajzának összeállításával értékeli az AI-ügynökök információszintézisét.

ArXiv AI·2 hónapjaAI

Kutatás

GraphBit: Gráfalapú rendszerrel szünteti meg az LLM-ek hibás útválasztását

A rendszer a nagyméretű nyelvi modellek (LLM) által vezérelt munkafolyamatokban gyakori hallucinált útválasztást és végtelen ciklusokat előzi meg, növelve a megbízhatóságot.

ArXiv AI·2 hónapjaAI

Kutatás

Diffúziós nyelvi modelleket javít a TraFL — minden teljesítményteszten felülmúlja az alapmodellt

A TraFL (Trajectory Flow baLancing) nevű új eljárás a diffúziós nyelvi modellek poszt-betanítási fázisában jelentkező „pályazár” problémát orvosolja, amely a megoldások szűk körére koncentrálja a modellt.

ArXiv ML·2 hónapjaAI

Kutatás

Pontosabb alaprajzokat készít az új AI — betartja a méretkorlátokat

A jelenlegi alaprajz-generáló AI-k főleg a helyiségek kapcsolódására fókuszálnak, de az új megközelítés már a pontos méreteket és területeket is képes kezelni.

ArXiv NLP·2 hónapjaAI

Kutatás

Többnyelvű AI-modellek tudásszerkesztését javítja egy új vektorösszegzési módszer

A nagyméretű nyelvi modellek (LLM) többnyelvű tudásszerkesztése (MKE) eddig komoly kihívást jelentett a nyelvi specifikus szerkesztések interferenciája miatt.

ArXiv NLP·2 hónapjaAI

Kutatás

Az LLM-ügynökök önismeretét és érzelmeit javítja egy új GraphRAG-módszer

Az új megközelítés a Maslow-piramis és Plutchik érzelemkereke alapján értékeli az elvárt viselkedéseket, ezzel mélyebb önismeretet és dilemmamegoldó képességet biztosítva az AI-nak.

ArXiv AI·2 hónapjaAI

Kutatás

LLM-desztilláció teljes energiaigényét méri a ComRAM — új mérési módszerrel

A kutatók részletes, szakaszokra bontott GPU-energiafogyasztás-követéssel vizsgálták a logit-alapú tudásdesztilláció és a szintetikus adatokkal történő finomhangolás energia- és kibocsátási adatait.

ArXiv ML·2 hónapjaAI

Kutatás

ProtoMedAgent: Új rendszerrel zárja ki a klinikai AI-hallucinációt az ArXiv kutatása

A ProtoMedAgent rendszer az orvosi dokumentációban gyakori „retrieval sycophancy” jelenséget küszöböli ki, ahol a nyelvi modellek téves magyarázatokat generálnak a vizuális előrejelzésekhez.

ArXiv CV·2 hónapjaAI

Kutatás

Költséghatékony génexpressziós előrejelzést ígér a DUET a hisztológiai képekből

A DUET nevű új módszer két paradigmát ötvözve kínál megoldást a meglévő rendszerek korlátaira, amelyek a vizuális hasonlóságra építenek, de nem garantálják a molekuláris konzisztenciát.

ArXiv CV·2 hónapjaAI

Kutatás

Új geometriai modell tisztázza a súlyozott kontrasztív tanulás működését

A súlyozási séma határozza meg, hogy a kontrasztív tanulás geometriailag megvalósítható, degenerált vagy inkonzisztens lesz-e, ami elvi alapot ad új célfüggvények tervezéséhez.

ArXiv ML·2 hónapjaAI

Kutatás

50%-kal kevesebb eszközt hív meg az ipari LLM-eknél a SPIN rendszer

Az új megközelítés a hibás vagy túl hosszú munkafolyamatokat kiküszöbölve növeli a nagyméretű nyelvi modellek (LLM) megbízhatóságát.

ArXiv AI·2 hónapjaAI

Kutatás

Hatékonyabb érvelést ígér az LLM-eknek az új Unary Relational Integracode

A jelenlegi nagyméretű nyelvi modellek (LLM) folyékony szöveget produkálnak, de a tartalom megbízhatóságát nehéz ellenőrizni, ezen segíthet az új eljárás.

ArXiv AI·2 hónapjaAI

Kutatás

Háromszor gyorsabb 3D objektumdetekciót ígér a SToRe3D rendszer

A Vision Transformer (ViT) modellek eddig lassúak voltak a többnézetes 3D objektumdetekcióban, de egy új módszer akár háromszoros sebességnövekedést is elérhet.

ArXiv CV·2 hónapjaAI

Kutatás

DeFakerOne: Új modell egyesíti a hamis kép detekciót és lokalizációt

A modell a generatív AI által létrehozott képhamisítványok széles skáláját képes azonosítani, a DeepFake-től a teljes AI-generált képekig.

ArXiv CV·2 hónapjaAI

Kutatás

Az AI-ügynökök elméletváltását érzékeli az új matematikai rendszer

A mesterséges intelligencia ügynököknek nem elég az egyenleteket illeszteni az adatokhoz, fel kell ismerniük, ha a meglévő reprezentációs keretrendszerük már nem alkalmazható.

ArXiv AI·2 hónapjaAI

Kutatás

Egyetlen GPU-n generál perces, 720p videót az NVIDIA új nyílt forráskódú modellje

A modell precíz 6-DoF kamera vezérléssel működik, és jelentős előrelépést jelent a valósághű AI-alapú szimulációk és a robotika területén.

MarkTechPost·2 hónapjaAI