Rovat · 22. oldal

Kutatás

AI research papers, arXiv publikációk, benchmarkok, tudományos áttörések

1159 cikk az archívumban

AC‑GATE 2 valós panelen bizonyítja a lag‑felfedezés pontosságát

A kutatók szintetikus panelen bizonyították, hogy a modell pontosan visszaállítja a valós lag‑eloszlásokat, így javítva a panel‑idősorok auditálhatóságát.

ArXiv ML·2 hónapjaAI

Kutatás

AutoTTS 70%-os token‑használat csökkentést ér el a self‑consistency‑hez képest

A kutatók a Claude Code ügynöknek egy szimulált környezetet adtak, ahol önállóan tervezett tesztidő‑skálázási algoritmust, amely 70%-os token‑használat csökkenést hoz, miközben a pontosság változatlan marad, és mindössze 40 USD költséggel, 160 perc alatt került felfedezésre.

The Decoder·2 hónapjaAI

Kutatás

Linear probera épülő elnyomás felfedi a döntési határt

Az arXiv‑en közzétett tanulmány szerzői a megtagadási viselkedés elnyomását latens‑tér eváziós támadásként modellezik.

ArXiv AI·2 hónapjaAI

Kutatás

DivSkill-SQL +11,1 ponttal növeli a Snowflake SQL pontosságot

A kutatók egy új residual skill optimalizációs keretrendszert mutattak be, amely modell finomhangolás nélkül épít kiegészítő ügynököket.

ArXiv NLP·2 hónapjaAI

Kutatás

TO-Agents két feladatban hoz hierarchikus ágstruktúrákat a tervezőknek

A kutatók a TO-Agents keretrendszert két hosszú távú tervezési feladaton tesztelték – egy tartóoszlop és egy telefonállvány – és a rendszer a felhasználó által megadott esztétikai preferenciáknak megfelelően hierarchikusan ágazó struktúrákat hozott létre.

ArXiv AI·2 hónapjaAI

Kutatás

Davinder Singh: 100 millió bit

Davinder Singh szerint a klasszikus adatok kvantumállapotokba történő betöltése komoly akadályt jelent, mivel a kvantumszámítógépek nem tudnak közvetlenül klasszikus biteket olvasni, ezért az adatokat qubitekbe kell ágyazni.

Towards Data Science·2 hónapjaAI

Kutatás

Túlzott AI-használat gyengítheti a logikai érvelést — mutatja egy új kutatás

A mesterséges intelligencia túlzott használata negatívan befolyásolhatja a logikai érvelési készségek fejlődését, főleg, ha az AI által nyújtott információ minősége alacsony.

ArXiv AI·2 hónapjaAI

Kutatás

Hatékonyabb gépi felejtést hoz az LLM-ekbe a DualOptim+ rendszer

A nagyméretű nyelvi modellek (LLM) betanítása során felmerülő adatvédelmi és biztonsági kihívásokat enyhítheti az új optimalizációs megoldás.

ArXiv ML·2 hónapjaAI

Kutatás

8B-paraméteres modellek verik a GPT-5-öt az ötlet-előrejelzésben: 77,1% pontosság

A mesterséges intelligencia által generált hipotézisek szűrése eddig szűk keresztmetszetet jelentett, de egy új módszerrel ez megváltozhat.

ArXiv ML·2 hónapjaAI

Kutatás

3-5-szörös gyorsulást hoz a szekvenciagenerálásban az új neurális módszer

A módszer a modell rejtett állapotai alapján becsüli meg a változók közötti kölcsönös információt, ami kulcsfontosságú az értelmezhetőség és a hatékony generálás szempontjából.

ArXiv ML·2 hónapjaAI

Kutatás

Collapse-and-refine elv

A collapse-and-refine elv szerint a zajszint függvényében két fázisban történik az adatok feldolgozása, ami jelentősen gyorsítja a tanulási folyamatot. Az adatok feldolgozása két szakaszban zajlik.

ArXiv ML·2 hónapjaAI

Kutatás

GROW-módszerrel gyorsítja a VLM-ügynökök nyílt világú feladatmegoldását az ArXiv

A GROW a teljes trajektóriák helyett állapot-akció mintákra bontja a feladatokat, így kiküszöböli a túlzottan hosszú kontextus és a zaj problémáját a betanítás során.

ArXiv ML·2 hónapjaAI

Kutatás

Új benchmarkkal méri az Apple a streamelt vizuális asszisztensek valós idejű teljesítményét

Az új értékelőrendszer a proaktivitást és a konzisztenciát is figyeli, szemben a korábbi, offline mérésekre fókuszáló módszerekkel.

Apple ML·2 hónapjaAI

Kutatás

A Decentraland közösségi hangulata előre jelezheti a kriptovaluta-árfolyamot

A Decentraland MANA token árfolyamát pontosabban megjósolja egy új modell, amely a pénzügyi adatok mellett a Discord közösség hangulatát is figyelembe veszi.

ArXiv NLP·2 hónapjaAI

Kutatás

Sem-Detect: Az AI-generált szakértői véleményeket is leleplezi az új módszer

A Sem-Detect nem csupán a szöveg stílusát vizsgálja, hanem a véleményekben kifejezett ötleteket és ítéleteket is elemzi, így pontosabban azonosítja a mesterséges intelligencia eredetét.

ArXiv NLP·2 hónapjaAI

Kutatás

AI ügynök publikált iOS appot az Apple Store-ba — új értékelési módszerrel tesztelve

A hagyományos teljesítménytesztek gyakran torzítják az AI valós teljesítményét, ezért a CRUX (Collaborative Research for Updating AI eXpectations) projekt új, nyílt világú értékeléseket vezet be.

ArXiv AI·2 hónapjaAI

Kutatás

Valósághűbb gyalogos-szimulációval javulhat az önvezető autók biztonsága

A jelenlegi önvezető autók szimulációi gyakran túlságosan leegyszerűsítik a gyalogosok viselkedését, ami korlátozza a biztonsági értékelések pontosságát, különösen a kiszámíthatatlan helyzetekben.

ArXiv ML·2 hónapjaAI

Kutatás

Öntanuló képgeneráló ügynök fejlődik vizuális visszajelzésekkel a GenEvolve-ban

A rendszer a generálási kísérleteket eszközökkel koordinált trajektóriaként modellezi, és nem egyszerű képszintű jutalmakra támaszkodik a fejlődésben.

ArXiv CV·2 hónapjaAI

Kutatás

AI-ügynökökkel mérhető a tárgyalási siker: új módszert mutat be az ArXiv

A tárgyalási elmélet régóta küzd a feszültségek kezelésével, de az AI-ügynökök precizitása és konzisztenciája áttörést hozhat a területen.

ArXiv AI·2 hónapjaAI

Kutatás

Új embedding-módszerrel gyorsítja a logikai következtetést a Horn-logikában az ArXiv-tanulmány

A neurális hálózatok hatékonyabban rangsorolhatják a logikai következtetők döntéseit, ha a logikai állítások numerikus reprezentációi, azaz az embeddingek, jobb minőségűek.

ArXiv AI·2 hónapjaAI

Kutatás

Generatív AI-val tennék elérhetőbbé a közlekedésbiztonsági adatokat a kutatók

A rendszer a nagyméretű nyelvi modelleket (LLM) használja a felhasználói szándék értelmezésére, miközben biztosítja az adatok megbízható és ellenőrizhető lekérdezését.

ArXiv NLP·2 hónapjaAI