ÉlőUtoljára: 4 perceMa: 16

Rovat · 8. oldal

Kutatás

AI research papers, arXiv publikációk, benchmarkok, tudományos áttörések

810 cikk az archívumban

Az AI tudásgyarapodásának korlátait modellezi az új NOVA rendszer
Kutatás

Az AI tudásgyarapodásának korlátait modellezi az új NOVA rendszer

A rendszer a „generál, ellenőriz, akkumulál, újratanít” ciklust adaptív mintavételezési folyamatként írja le egy tudástérben.

ArXiv AI·AI
Új CDC rendszerrel generál hibátlan kódot a diszkrét diffúzió – képzési fázis nélkül
Kutatás

Új CDC rendszerrel generál hibátlan kódot a diszkrét diffúzió – képzési fázis nélkül

A CDC rendszer a diszkrét diffúziós modellek iteratív finomítási folyamatába építi be a programszintű funkcionális és biztonsági korlátokat, még a kód véglegesítése előtt.

ArXiv NLP·AI
Kisebb nyelvi modellek is hatékonyak lehetnek bírósági ítéletek generálásában
Kutatás

Kisebb nyelvi modellek is hatékonyak lehetnek bírósági ítéletek generálásában

A 2 milliárd paraméternél kisebb modellek is megbízhatóan képesek bírósági ítéleteket generálni és vádat előrejelezni büntetőügyekben.

ArXiv NLP·AI
Logaritmikusan romlik a LLM-ügynökök képességválasztása a könyvtár méretével
Kutatás

Logaritmikusan romlik a LLM-ügynökök képességválasztása a könyvtár méretével

A kutatók 15 élvonalbeli nagyméretű nyelvi modell (LLM) és több mint 1100 valós képesség elemzésével azonosították a rendszerek működését meghatározó két alapvető törvényt.

ArXiv NLP·AI
8,7-szer gyorsabb képfeldolgozást ígér a TaTok új tokenizációs módszer
Kutatás

8,7-szer gyorsabb képfeldolgozást ígér a TaTok új tokenizációs módszer

A jelenlegi kép-tokenizációs eljárások gyakran redundanciát vagy információvesztést okoznak, de a TaTok ezt a problémát orvosolja, különösen a hosszú képszekvenciák feldolgozásánál.

ArXiv CV·AI
22,7 FPS-re gyorsítja a diffúziós modelleket az Apple M3 Ultrán egy új optimalizálás
Kutatás

22,7 FPS-re gyorsítja a diffúziós modelleket az Apple M3 Ultrán egy új optimalizálás

A 60 magos GPU-val és 512 GB egységes memóriával szerelt M3 Ultra chipen a CoreML konverzió és a SDXS-512 modell kombinációja hozta meg az áttörést.

ArXiv ML·AI
Új módszerrel beszélhetünk a nem-neurális rendszerekkel — a ComRAM a nyelv belső dinamikáját használja
Kutatás

Új módszerrel beszélhetünk a nem-neurális rendszerekkel — a ComRAM a nyelv belső dinamikáját használja

A ComRAM nevű megközelítés a rendszer belső dinamikáját használja fel, hogy a ne csak proxy modellek, hanem saját hangján szólaljon meg.

ArXiv ML·AI
RTI-Bench: Indiai jogi döntések elemzésére készült új adathalmaz 89%-os lefedettséggel
Kutatás

RTI-Bench: Indiai jogi döntések elemzésére készült új adathalmaz 89%-os lefedettséggel

Az új, strukturált adathalmaz az indiai információszabadság-törvény (RTI) alapján hozott döntéseket elemzi, segítve az állampolgárokat a bonyolult jogi nyelvezet megértésében.

ArXiv NLP·AI
Döntési kapacitásküszöb okozhatja az öntanuló AI-modellek összeomlását
Kutatás

Döntési kapacitásküszöb okozhatja az öntanuló AI-modellek összeomlását

A jelenség pókerjátékokban, mátrixjátékokban és kockajátékokban is megfigyelhető, több tanulási algoritmus esetében is hasonló eredményt mutat.

ArXiv ML·AI
Adam optimalizálóval gyorsabban tanulnak a ritka tokenek a nyelvi modellekben
Kutatás

Adam optimalizálóval gyorsabban tanulnak a ritka tokenek a nyelvi modellekben

A modern nyelvi modellek képzése során a tokenek eloszlása rendkívül egyenetlen, ami eddig rejtett optimalizációs kihívást jelentett, de az Adam ezt orvosolja.

MarkTechPost·AI
Az IBM Research új Open Agent Leaderboardja az AI-ügynökök valós költségét is méri
Kutatás

Az IBM Research új Open Agent Leaderboardja az AI-ügynökök valós költségét is méri

A ranglista nemcsak a modellek teljesítményét, hanem a teljes ügynökrendszerek minőségét és futtatási költségét is figyelembe veszi, ezzel segítve a valós telepítési döntéseket.

Hugging Face·AI
Dr. Gail Joseph ellenállásba ütközik
Kutatás

Dr. Gail Joseph ellenállásba ütközik

A Washingtoni Egyetem kutatói leállították az óvodai AI-projektjüket, miután a szülők ellenállása miatt nem tudták első személyű felvételeket készíteni a gyerekekről. A projekt célja az osztálytermi interakciók minőségét értékelő AI-modellek fejlesztése lett volna.

404 Media·AI
Zhejiang Egyetem: 100%-os támadási siker
Kutatás

Zhejiang Egyetem: 100%-os támadási siker

A mesterséges intelligencia alapú hangrendszereket rejtett hangtámadásokkal lehet jogosulatlan parancsok végrehajtására kényszeríteni. Az AudioHijack technika emberi fül számára észrevehetetlen hangokkal működik.

IEEE Spectrum AI·AI
Nehezebb feladatoknál másképp gondolkodnak a mesterséges intelligencia modellek
Kutatás

Nehezebb feladatoknál másképp gondolkodnak a mesterséges intelligencia modellek

A lánc-gondolkodás (chain-of-thought) során a modellek rejtett állapotainak elemzése alapján a nehezebb problémákra adott válaszok belső 'útvonala' is eltérő.

ArXiv NLP·AI
Helyi AI-ügynökök: energiafaló működésüket korai leállítással fékeznék meg
Kutatás

Helyi AI-ügynökök: energiafaló működésüket korai leállítással fékeznék meg

A nagyméretű nyelvi modelleken (LLM) alapuló autonóm ügynökök egyre több összetett feladatot automatizálnak, de helyi futtatásuk jelentős energiaigénnyel jár.

ArXiv ML·AI
Iteratív finomítással javítaná a képgenerálás minőségét és diverzitását a RTM
Kutatás

Iteratív finomítással javítaná a képgenerálás minőségét és diverzitását a RTM

A képgeneráló modellek, mint a Stable Diffusion vagy a Midjourney, hiába fejlődtek látványosan, továbbra is küzdenek a módusösszeomlással és a korlátozott diverzitással.

ArXiv CV·AI
Félakkora modell is biztonságos marad az OPSA módszerrel — csökken a "biztonsági adó"
Kutatás

Félakkora modell is biztonságos marad az OPSA módszerrel — csökken a "biztonsági adó"

A nyelvi modellek biztonságosabbá tétele eddig gyakran a logikai képességek romlásával járt, ezt a kompromisszumot nevezték "biztonsági adónak" — most egy új módszer enyhítheti a problémát.

ArXiv ML·AI
Folyamatosan tanul a Solvita: új keretrendszerrel oldja meg a LLM-ek programozási kihívásait
Kutatás

Folyamatosan tanul a Solvita: új keretrendszerrel oldja meg a LLM-ek programozási kihívásait

A Solvita négy specializált ágenssel — Planner, Solver, Oracle és Hacker — dolgozik, mindegyikhez egy betanítható, gráfstruktúrájú tudáshálózat tartozik.

ArXiv AI·AI
Új ICRL rendszerrel tanulnak önkritikát az AI-modellek — javul a hibajavítás
Kutatás

Új ICRL rendszerrel tanulnak önkritikát az AI-modellek — javul a hibajavítás

A rendszer egy megoldó és egy kritikus modellt képez közösen, így a kritikákból származó sikereket önálló képességgé alakítja át.

ArXiv AI·AI
LLM-ek célfelismerő képességeit vizsgálja új kutatás — eltérő eredményekkel
Kutatás

LLM-ek célfelismerő képességeit vizsgálja új kutatás — eltérő eredményekkel

A klasszikus tervezőalgoritmusokhoz képest a LLM-ek eddig inkább a világismeretükre támaszkodtak, mintsem a szimbolikus érvelésre, de a célfelismerés más megközelítést igényel.

ArXiv AI·AI
Az emberi kommunikáció inkább „mohó” mint optimális — állítja az ArXiv tanulmánya
Kutatás

Az emberi kommunikáció inkább „mohó” mint optimális — állítja az ArXiv tanulmánya

A tanulmányban a kutatók azt vizsgálták, hogyan reagálnak az emberek különböző kérdésekre, ha szókincsüket akár 250 gyakori szóra korlátozzák.

ArXiv NLP·AI

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom