ÉlőUtoljára: 41 perceMa: 23

Rovat · 13. oldal

Kutatás

AI research papers, arXiv publikációk, benchmarkok, tudományos áttörések

813 cikk az archívumban

Interaktív IRL-t fejlesztettek ki a kutatók: kétlépcsős optimalizációval tanul a modell
Kutatás

Interaktív IRL-t fejlesztettek ki a kutatók: kétlépcsős optimalizációval tanul a modell

Az új megközelítés lehetővé teszi, hogy a tanuló aktívan kommunikáljon a szakértővel, nem csak passzívan megfigyelje annak demonstrációit, ezzel áthidalva a korábbi IRL-rendszerek korlátait.

ArXiv ML·AI
Új oktatási AI-rendszerrel fordítják le a tudást explicit szabályokra
Kutatás

Új oktatási AI-rendszerrel fordítják le a tudást explicit szabályokra

A Cognitive Agent Compilation (CAC) egy erős tanár LLM segítségével fordítja le a problémamegoldó tudást explicit célügynökökké, ami könnyebben szerkeszthető és átlátható rendszereket eredményez.

ArXiv NLP·AI
IntentGrasp: Új teljesítményteszt méri a LLM-ek szándékfelismerését, 20 modell is gyengén teljesít
Kutatás

IntentGrasp: Új teljesítményteszt méri a LLM-ek szándékfelismerését, 20 modell is gyengén teljesít

A 12 különböző domainből származó, 49 nyílt licencű korpuszból összeállított tesztkészlet a beszéd, a beszélgetés és az írás mögötti szándék megértését értékeli.

ArXiv NLP·AI
Weblica: Ezer webes környezetben képez ki vizuális AI-ügynököket az új rendszer
Kutatás

Weblica: Ezer webes környezetben képez ki vizuális AI-ügynököket az új rendszer

A Weblica (Web Replica) HTTP-szintű gyorsítótárazást és LLM-alapú környezetszintézist használ, így kiküszöböli a hagyományos módszerek korlátait.

ArXiv AI·AI
Új diffúziós modell javítja az antitest-tervezést — rugalmasabb generálást ígér
Kutatás

Új diffúziós modell javítja az antitest-tervezést — rugalmasabb generálást ígér

A mesterséges intelligencia alapú antitest-tervezés kulcsfontosságú a modern gyógyászatban, de a kívánt kötési és fejleszthetőségi tulajdonságokkal rendelkező antitestek létrehozása eddig komoly kihívást jelentett.

ArXiv ML·AI
Az AGWM modell pontosabban jósolja meg a robotok viselkedését változó környezetben
Kutatás

Az AGWM modell pontosabban jósolja meg a robotok viselkedését változó környezetben

A hagyományos világmodellek gyakran figyelmen kívül hagyják az akciók előfeltételeit, ami pontatlan előrejelzésekhez vezet, különösen dinamikus környezetekben.

ArXiv AI·AI
Kétlépcsős módszerrel javítja a képhamisítás-detektálást az új ComRAM rendszer
Kutatás

Kétlépcsős módszerrel javítja a képhamisítás-detektálást az új ComRAM rendszer

A digitális képhamisítások elleni küzdelemben egy új, transzfertanuláson alapuló rendszer ígér áttörést, amely a tömörítési különbségeket is figyelembe veszi a manipulációk észlelésénél.

ArXiv CV·AI
Új Agent-BOM rendszerrel ellenőrizhetők a LLM-alapú AI-ügynökök biztonsági kockázatai
Kutatás

Új Agent-BOM rendszerrel ellenőrizhetők a LLM-alapú AI-ügynökök biztonsági kockázatai

A rendszer egy hierarchikus, attribútumokkal ellátott irányított gráffal modellezi az ügynöki rendszereket, elkülönítve a statikus képességeket a dinamikus futásidejű szemantikától.

ArXiv AI·AI
A KARMA-MV adatbázis 2,682 YouTube zenés videót tartalmaz
Kutatás

A KARMA-MV adatbázis 2,682 YouTube zenés videót tartalmaz

A 2682 YouTube zenei videóból származó, nagyméretű, többválasztós kérdés-válasz adathalmaz a vizuális dinamika és a zenei struktúra közötti ok-okozati összefüggéseket vizsgálja.

ArXiv CV·AI
Új Auto-Rubric módszerrel javul a multimodális AI-modellek értékelése
Kutatás

Új Auto-Rubric módszerrel javul a multimodális AI-modellek értékelése

A rendszer a vizuális nyelvi modellek (VLM) belső preferenciáit prompt-specifikus rubrikákká alakítja, így a holisztikus szándékot önállóan ellenőrizhető minőségi dimenziókká bontja.

ArXiv AI·AI
Redundanciával csökkentenék a vizuális hallucinációkat a nyelvi modelleknél
Kutatás

Redundanciával csökkentenék a vizuális hallucinációkat a nyelvi modelleknél

A vizuális nyelvi modellek (VLM) gyakran szenvednek hallucinációktól és gyenge robusztusságtól homályos vagy sérült bemenetek esetén, ezt oldaná meg a redundancia növelése.

ArXiv CV·AI
AI-karakterek egységes személyiségét hozza létre az UniCharacter — 10 képpel tanul
Kutatás

AI-karakterek egységes személyiségét hozza létre az UniCharacter — 10 képpel tanul

A modell mindössze 10 kép és a hozzá tartozó interakciós példák alapján képes elsajátítani a célkaraktert, és koherens személyiséget, stílust és vizuális identitást mutat mind a generált szövegben, mind a képben.

ArXiv ML·AI
Cramér-távolság alapú DSAC-algoritmus javítja a robotok tanulását
Kutatás

Cramér-távolság alapú DSAC-algoritmus javítja a robotok tanulását

Az új megközelítés az állapot-akció értékeket eloszlásos megerősítő tanulással reprezentálja, és a Cramér-távolságot minimalizálja az eloszlás betanításához.

ArXiv ML·AI
Új BalCapRL rendszerrel javítja az Apple a MLLM képleírások minőségét
Kutatás

Új BalCapRL rendszerrel javítja az Apple a MLLM képleírások minőségét

A BalCapRL egy kiegyensúlyozott megerősítő tanulás (RL) alapú megközelítés, amely a képleírások minőségét optimalizálja, elkerülve a korábbi módszerek kompromisszumait.

Apple ML·AI
James Shore: az AI kódgenerálás csak arányos karbantartáscsökkentéssel éri meg
Kutatás

James Shore: az AI kódgenerálás csak arányos karbantartáscsökkentéssel éri meg

A szakértő amellett érvel, hogy az AI-ügynökök által generált kódmennyiség növekedése önmagában nem jelent megtakarítást, sőt, hosszú távon növelheti a kiadásokat.

Simon Willison·AI
TwELL: új CUDA-kernel gyorsítja a LLM-ek betanítását 21,9%-kal, inferenciáját 20,5%-kal
Kutatás

TwELL: új CUDA-kernel gyorsítja a LLM-ek betanítását 21,9%-kal, inferenciáját 20,5%-kal

A TwELL nevű megoldás a feedforward rétegek számításait teszi olcsóbbá a strukturálatlan ritkaság kihasználásával, anélkül, hogy a modell architektúráját megváltoztatná.

MarkTechPost·AI
iPSD: Önállóan tisztítja az EEG-jeleket az új mélytanulási módszer
Kutatás

iPSD: Önállóan tisztítja az EEG-jeleket az új mélytanulási módszer

A rendszer a bemeneti EEG-szegmenst független, zajos részekre bontja, amelyek azonos alapjelet tartalmaznak, ezzel lehetővé téve az önszupervíziós betanítást.

ArXiv ML·AI
Feleannyi memóriával futnak a nyelvi modellek az új Toeplitz MLP Mixerrel
Kutatás

Feleannyi memóriával futnak a nyelvi modellek az új Toeplitz MLP Mixerrel

A Toeplitz MLP Mixer (TMM) felváltja a transzformerek figyelem-mechanizmusát, így a betanítás során O(dn log n) idő- és O(dn) térkomplexitással dolgozik.

ArXiv ML·AI
Folyamatos minőségi pontszámokkal értékeli a képfúziót az új FuScore MLLM
Kutatás

Folyamatos minőségi pontszámokkal értékeli a képfúziót az új FuScore MLLM

Az infravörös-látható képfúzió (IVIF) célja a hőinformáció és a térbeli részletek egyesítése egyetlen képpé, ám a jelenlegi értékelési módszerek korlátozottak.

ArXiv CV·AI
Hétféle betegzajjal teszteli a klinikai diagnózist a MedExAgent LLM
Kutatás

Hétféle betegzajjal teszteli a klinikai diagnózist a MedExAgent LLM

Az új LLM-ügynök a jelenlegi egyszerűsített modellekkel szemben a klinikai diagnózis komplexitását kezeli, interaktívabb és valósághűbb megközelítéssel.

ArXiv NLP·AI
MultiSoc-4D: A bengáli közösségi média adatbázis leplezi le a LLM-ek hibáját
Kutatás

MultiSoc-4D: A bengáli közösségi média adatbázis leplezi le a LLM-ek hibáját

A 58 ezer bejegyzést tartalmazó adatbázis négy dimenzió mentén — kategória, hangulat, gyűlöletbeszéd és szarkazmus — annotálja a tartalmakat.

ArXiv NLP·AI

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom