Rovat · 25. oldal

Kutatás

AI research papers, arXiv publikációk, benchmarkok, tudományos áttörések

1159 cikk az archívumban

22,7 FPS-re gyorsítja a diffúziós modelleket az Apple M3 Ultrán egy új optimalizálás

A 60 magos GPU-val és 512 GB egységes memóriával szerelt M3 Ultra chipen a CoreML konverzió és a SDXS-512 modell kombinációja hozta meg az áttörést.

ArXiv ML·2 hónapjaAI

Kutatás

Új módszerrel beszélhetünk a nem-neurális rendszerekkel — a ComRAM a nyelv belső dinamikáját használja

A ComRAM nevű megközelítés a rendszer belső dinamikáját használja fel, hogy a ne csak proxy modellek, hanem saját hangján szólaljon meg.

ArXiv ML·2 hónapjaAI

Kutatás

RTI-Bench: Indiai jogi döntések elemzésére készült új adathalmaz 89%-os lefedettséggel

Az új, strukturált adathalmaz az indiai információszabadság-törvény (RTI) alapján hozott döntéseket elemzi, segítve az állampolgárokat a bonyolult jogi nyelvezet megértésében.

ArXiv NLP·2 hónapjaAI

Kutatás

Döntési kapacitásküszöb okozhatja az öntanuló AI-modellek összeomlását

A jelenség pókerjátékokban, mátrixjátékokban és kockajátékokban is megfigyelhető, több tanulási algoritmus esetében is hasonló eredményt mutat.

ArXiv ML·2 hónapjaAI

Kutatás

Adam optimalizálóval gyorsabban tanulnak a ritka tokenek a nyelvi modellekben

A modern nyelvi modellek képzése során a tokenek eloszlása rendkívül egyenetlen, ami eddig rejtett optimalizációs kihívást jelentett, de az Adam ezt orvosolja.

MarkTechPost·2 hónapjaAI

Kutatás

Az IBM Research új Open Agent Leaderboardja az AI-ügynökök valós költségét is méri

A ranglista nemcsak a modellek teljesítményét, hanem a teljes ügynökrendszerek minőségét és futtatási költségét is figyelembe veszi, ezzel segítve a valós telepítési döntéseket.

Hugging Face·2 hónapjaAI

Kutatás

Dr. Gail Joseph ellenállásba ütközik

A Washingtoni Egyetem kutatói leállították az óvodai AI-projektjüket, miután a szülők ellenállása miatt nem tudták első személyű felvételeket készíteni a gyerekekről. A projekt célja az osztálytermi interakciók minőségét értékelő AI-modellek fejlesztése lett volna.

404 Media·2 hónapjaAI

Kutatás

Zhejiang Egyetem: 100%-os támadási siker

A mesterséges intelligencia alapú hangrendszereket rejtett hangtámadásokkal lehet jogosulatlan parancsok végrehajtására kényszeríteni. Az AudioHijack technika emberi fül számára észrevehetetlen hangokkal működik.

IEEE Spectrum AI·2 hónapjaAI

Kutatás

Nehezebb feladatoknál másképp gondolkodnak a mesterséges intelligencia modellek

A lánc-gondolkodás (chain-of-thought) során a modellek rejtett állapotainak elemzése alapján a nehezebb problémákra adott válaszok belső 'útvonala' is eltérő.

ArXiv NLP·2 hónapjaAI

Kutatás

Helyi AI-ügynökök: energiafaló működésüket korai leállítással fékeznék meg

A nagyméretű nyelvi modelleken (LLM) alapuló autonóm ügynökök egyre több összetett feladatot automatizálnak, de helyi futtatásuk jelentős energiaigénnyel jár.

ArXiv ML·2 hónapjaAI

Kutatás

Iteratív finomítással javítaná a képgenerálás minőségét és diverzitását a RTM

A képgeneráló modellek, mint a Stable Diffusion vagy a Midjourney, hiába fejlődtek látványosan, továbbra is küzdenek a módusösszeomlással és a korlátozott diverzitással.

ArXiv CV·2 hónapjaAI

Kutatás

Félakkora modell is biztonságos marad az OPSA módszerrel — csökken a "biztonsági adó"

A nyelvi modellek biztonságosabbá tétele eddig gyakran a logikai képességek romlásával járt, ezt a kompromisszumot nevezték "biztonsági adónak" — most egy új módszer enyhítheti a problémát.

ArXiv ML·2 hónapjaAI

Kutatás

Folyamatosan tanul a Solvita: új keretrendszerrel oldja meg az LLM-ek programozási kihívásait

A Solvita négy specializált ágenssel — Planner, Solver, Oracle és Hacker — dolgozik, mindegyikhez egy betanítható, gráfstruktúrájú tudáshálózat tartozik.

ArXiv AI·2 hónapjaAI

Kutatás

Új ICRL rendszerrel tanulnak önkritikát az AI-modellek — javul a hibajavítás

A rendszer egy megoldó és egy kritikus modellt képez közösen, így a kritikákból származó sikereket önálló képességgé alakítja át.

ArXiv AI·2 hónapjaAI

Kutatás

LLM-ek célfelismerő képességeit vizsgálja új kutatás — eltérő eredményekkel

A klasszikus tervezőalgoritmusokhoz képest az LLM-ek eddig inkább a világismeretükre támaszkodtak, mintsem a szimbolikus érvelésre, de a célfelismerés más megközelítést igényel.

ArXiv AI·2 hónapjaAI

Kutatás

Az emberi kommunikáció inkább „mohó” mint optimális — állítja az ArXiv tanulmánya

A tanulmányban a kutatók azt vizsgálták, hogyan reagálnak az emberek különböző kérdésekre, ha szókincsüket akár 250 gyakori szóra korlátozzák.

ArXiv NLP·2 hónapjaAI

Kutatás

Ghánai joghallgatókat segít az Eskwai for Students AI — 32 ezer lekérdezést kezeltek

Az Eskwai for Students nevű generatív AI-asszisztens 12 ezer esetjog és 1400 jogszabály alapján válaszol jogi kérdésekre, ezzel segítve a ghánai joghallgatókat.

ArXiv NLP·2 hónapjaAI

Kutatás

OP-Mix: új adatmixelő algoritmus egységesíti a nyelvi modellek betanítását

Az új megközelítés a jelölt adatmixeket olcsón szimulálja alacsony rangú adapterek interpolálásával, amelyeket közvetlenül betanítottak.

ArXiv NLP·2 hónapjaAI

Kutatás

RAG-alapú rendszer gyorsítja a nővér-beteg beszélgetések elemzését

A klinikai adatok strukturálása eddig időigényes feladat volt, de egy moduláris RAG-folyamat most jelentősen egyszerűsíti a nővér-beteg párbeszédek elemzését.

ArXiv NLP·2 hónapjaAI

Kutatás

MR2-ByteTrack: új videóobjektum-észlelési módszer CNN és Transformer alapokon

A rendszer a felbontások váltogatásával és egy új Rescore algoritmussal optimalizálja a teljesítményt, miközben a pontosságot fenntartja.

ArXiv CV·2 hónapjaAI

Kutatás

Új Social-Mamba modell a tömeges környezetekben való navigációhoz

Az új architektúra a szociális interakciókat strukturált szekvenciális folyamatokként értelmezi újra, ami jelentősen növeli a számítási hatékonyságot.

ArXiv CV·2 hónapjaAI