ÉlőUtoljára: 18 perceMa: 25

Rovat · 26. oldal

Kutatás

AI research papers, arXiv publikációk, benchmarkok, tudományos áttörések

813 cikk az archívumban

Automatizált AI kutatás: az Anthropic ügynökei felülmúlják az emberi szakértőket
Kutatás

Automatizált AI kutatás: az Anthropic ügynökei felülmúlják az emberi szakértőket

Az Anthropic kutatói sikeresen automatizálták az AI biztonsági kutatást, ahol az AI ügynökök jobban teljesítettek, mint az emberi kutatók a gyenge-erős felügyelet területén.

Import AI·AI
ArXiv: A szekvenciális KV cache tömörítés túlszárnyalja a per-vektor limiteket
Kutatás

ArXiv: A szekvenciális KV cache tömörítés túlszárnyalja a per-vektor limiteket

A nagyméretű nyelvi modellek (LLM) működését gyorsító KV cache tömörítés új megközelítése jelentősen javíthatja az inferencia sebességét.

ArXiv ML·AI
A komplex ábrák megfelezik a legjobb AI-modellek teljesítményét
Kutatás

A komplex ábrák megfelezik a legjobb AI-modellek teljesítményét

A legfejlettebb, zárt forráskódú AI-modellek is közel felére esik vissza a teljesítményük, amikor valós adatokból épített, összetett vizualizációkat kell értelmezniük.

The Decoder·AI
Már 10 perc AI-használat is rontja a problémamegoldó képességet
Kutatás

Már 10 perc AI-használat is rontja a problémamegoldó képességet

Egy új tanulmány szerint az AI-használat rövid ideig tartó megszokása is negatív hatással lehet a felhasználók teljesítményére, függetlenül attól, hogy milyen feladatokat kell megoldaniuk.

The Decoder·AI
Új keretrendszer tanítja meg a modelleket a kódtváltásra a jobb érvelésért
Kutatás

Új keretrendszer tanítja meg a modelleket a kódtváltásra a jobb érvelésért

A nagyméretű nyelvi modellek (LLM) érvelési képességei jelentősen fejlődtek az utóbbi időben, ám a nyelvkeverés, vagyis a kódtváltás eddig kihívást jelentett a fejlesztőknek.

ArXiv NLP·AI
DeepSeek V3: új figyelem és MoE-rétegekkel javítja a LLM-hatékonyságot
Kutatás

DeepSeek V3: új figyelem és MoE-rétegekkel javítja a LLM-hatékonyságot

A DeepSeek V3 architektúra két kulcsfontosságú technológiát vezet be: az új figyelmi mechanizmust és a MoE-rétegeket, amelyek jelentősen javítják a számítási hatékonyságot.

Ahead of AI·AI
PolicyBank: Új memóriamechanizmus segíti a LLM-ügynökök szabálykövetését
Kutatás

PolicyBank: Új memóriamechanizmus segíti a LLM-ügynökök szabálykövetését

A PolicyBank egy új memóriamechanizmus, amely lehetővé teszi a nagyméretű nyelvi modellek (LLM) alapú ügynökök számára, hogy interaktív visszajelzésekkel finomítsák szabályértelmezésüket.

ArXiv NLP·AI
Mollick: A multimodális AI nem hoz emberi szintű AGI-t a közeljövőben
Kutatás

Mollick: A multimodális AI nem hoz emberi szintű AGI-t a közeljövőben

A jelenlegi multimodális AI-megközelítések, amelyek különböző modalitásokat ragasztanak össze, nem elegendőek az emberi szintű általános mesterséges intelligencia (AGI) eléréséhez a közeljövőben.

The Gradient·AI
Új Triton kernel gyorsítja a Vision Transformer modelleket az ArXiv szerint
Kutatás

Új Triton kernel gyorsítja a Vision Transformer modelleket az ArXiv szerint

A Vision Transformer (ViT) modellek feldolgozási sebessége jelentősen javulhat egy új, könnyűsúlyú Triton figyelmi kernellel, amely a token-metszés előnyeit a gyakorlatban is érvényesíti.

ArXiv ML·AI
Új KWBench mérce teszteli a LLM-ek problémamegértését
Kutatás

Új KWBench mérce teszteli a LLM-ek problémamegértését

A KWBench az első olyan teljesítményteszt, amely kifejezetten a nagyméretű nyelvi modellek (LLM) azon képességét értékeli, hogy önállóan felismerjék egy professzionális forgatókönyv mögöttes struktúráját.

ArXiv AI·AI
A LLM-ek rontják a dokumentumokat: 25%-os hibát találtak a hosszú munkafolyamatokban
Kutatás

A LLM-ek rontják a dokumentumokat: 25%-os hibát találtak a hosszú munkafolyamatokban

A mesterséges intelligencia modellek, még a legfejlettebbek is, jelentős hibákat vétenek a dokumentumok szerkesztése során, ha hosszú, delegált feladatokat kapnak.

ArXiv NLP·AI
A GIST új AI-modellje térképezi fel a zsúfolt tereket mobilfelhőből
Kutatás

A GIST új AI-modellje térképezi fel a zsúfolt tereket mobilfelhőből

A GIST (Grounded Intelligent Semantic Topology) rendszer a kiskereskedelmi üzletek, raktárak és kórházak összetett környezetét alakítja át navigálható, szemantikusan annotált topológiává.

ArXiv AI·AI
AdaVFM: Új keretrendszer hozza el a vizuális AI-t a peremeszközökre
Kutatás

AdaVFM: Új keretrendszer hozza el a vizuális AI-t a peremeszközökre

Egy új adaptív keretrendszer, az AdaVFM teszi lehetővé a nyelvvel összehangolt vizuális alapmodellek (VFM) hatékony futtatását peremeszközökön, dinamikus számítási optimalizálással.

ArXiv CV·AI
Félakkora modell is érti a kontextust: az OpenMythos feltárja a Claude Mythos titkát
Kutatás

Félakkora modell is érti a kontextust: az OpenMythos feltárja a Claude Mythos titkát

Az OpenMythos projekt feltárta az Anthropic Claude Mythos architektúrájának titkát, és egy új, nyílt forráskódú modellt hozott létre, amely kevesebb paraméterrel is hasonló teljesítményt ér el. A projekt 2024-ben indult és most publikálta az eredményeit.

MarkTechPost·AI
Új AI-magyarázó keretrendszer garantálja a biztonságot az autonóm járművekben
Kutatás

Új AI-magyarázó keretrendszer garantálja a biztonságot az autonóm járművekben

A mesterséges intelligencia magyarázhatóságát vizsgáló új keretrendszer, a ViTaX, a téves besorolások eltérő súlyosságát is figyelembe veszi, ami kulcsfontosságú az önvezető autók és orvosi diagnosztikai rendszerek esetében.

ArXiv ML·AI
AI-függőség: Tíz perc is elég, hogy romoljon a teljesítmény
Kutatás

AI-függőség: Tíz perc is elég, hogy romoljon a teljesítmény

Az AI-asszisztencia használata már tíz perc alatt függőséget okozhat, ami romló teljesítményhez és kiégéshez vezet. Az eszközök elvonása után a teljesítmény romlása figyelhető meg.

Hacker News·AI
Pneuma-Seeker: új AI-ügynök pontosítja az adatelemzők homályos kérdéseit
Kutatás

Pneuma-Seeker: új AI-ügynök pontosítja az adatelemzők homályos kérdéseit

A rendszerrel a felhasználók információigényeit explicit, ellenőrizhető relációs specifikációkká alakíthatják, ami célzott adatfeltárást tesz lehetővé.

ArXiv AI·AI
Új AI-rendszer elemzi a tengeri vészjelzéseket: SeaAlert a zajos üzenetekből is kiszűri a lényeget
Kutatás

Új AI-rendszer elemzi a tengeri vészjelzéseket: SeaAlert a zajos üzenetekből is kiszűri a lényeget

A tengeri vészhelyzetekben kulcsfontosságú, szabványtól eltérő, zajos üzenetekből is képes kinyerni a kritikus információkat egy új, mesterséges intelligencia alapú rendszer.

ArXiv NLP·AI
TOPCELL: LLM optimalizálja a 2 nanométeres chipek tranzisztorait
Kutatás

TOPCELL: LLM optimalizálja a 2 nanométeres chipek tranzisztorait

A TOPCELL egy új, skálázható keretrendszer, amely nagyméretű nyelvi modelleket (LLM) használ a tranzisztor-topológia optimalizálására a standard cellák tervezésénél.

ArXiv ML·AI
Skálázható RL-paradigmát mutatott be az ArXiv: a Value Gradient Flow
Kutatás

Skálázható RL-paradigmát mutatott be az ArXiv: a Value Gradient Flow

A Value Gradient Flow (VGF) névre keresztelt módszer a viselkedés-szabályozott megerősítő tanulás (RL) problémáira kínál skálázható megoldást, ami kritikus a nagy generatív modellek finomhangolásánál.

ArXiv ML·AI
AIBuildAI: Új AI-ügynök épít mesterséges intelligencia modelleket feladatra szabva
Kutatás

AIBuildAI: Új AI-ügynök épít mesterséges intelligencia modelleket feladatra szabva

Az új rendszer célja, hogy a mesterséges intelligencia modellek fejlesztését a jelenlegi munkaigényes folyamatból egy automatizált, hatékonyabb metódussá alakítsa.

ArXiv AI·AI

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom