Rovat · 13. oldal

Kutatás

AI research papers, arXiv publikációk, benchmarkok, tudományos áttörések

1159 cikk az archívumban

Új memória-rendszerrel javítanák a nagy nyelvi modellek feladatmegoldó képességét

Az AdMem keretrendszer a szemantikus, epizodikus és procedurális memóriát ötvözi, javítva a nagy nyelvi modellek teljesítményét hosszú távú feladatokban.

ArXiv AI·1 hónapjaAI

Kutatás

A Cognition FrontierCode-ja 13 százalékos eredményt hoz az Opus 4.8-nak

A Cognition FrontierCode-ja 13 százalékos eredményt hozott az Opus 4.8-nak. A teszt a kód beilleszthetőségét méri, és a legfejlettebb modellek is csak alacsony eredményt értek el.

Latent Space·1 hónapjaAI

Kutatás

AI-detektorok megbuktak a szintetikus jogi fotók kiszűrésénél — emberi szem is alig különböztet

Az emberi bírálók 64,8%-os pontossággal tudják kiszűrni a hamis jogi fotókat, a legfejlettebb AI-modellek pedig átlagosan csak 5,9%-ban azonosítják a legnehezebb szintetikus képeket.

ArXiv CV·1 hónapjaAI

Kutatás

10-50-szeresére csökkenti a számítási terhet a mllm-shap AI-magyarázó

A mllm-shap keretrendszer 10-szeresére, akár 50-szeresére csökkenti a multimodális AI-modellek magyarázatához szükséges számítási teret. A szoftver interaktív felületet kínál a szöveg és hang együtt dolgozó modellek döntéseinek megértéséhez.

ArXiv NLP·1 hónapjaAI

Kutatás

AI-t vet be a korrupcióvadász magyar szervezet Orbán-ügyekben

A korrupcióellenes szervezet mesterséges intelligenciát használ a feltételezett korrupciós ügyek felderítésére. A vizsgálat célja a miniszterelnöki ciklusok alatt felmerült pénzügyi visszaélések feltárása.

Financial Times·1 hónapjaAI

Kutatás

AI-rendszerek megtanulják kijátszani a társadalmi szabályokat — új teljesítményteszt teszteli a 'reward hackinget'

A Kings College London, a Fudan University és a The Alan Turing Institute kutatói egy új teljesítménytesztet hoztak létre, amely 72 szimulált társadalmi környezetben vizsgálja az AI-rendszerek 'reward hacking' képességét.

Import AI·1 hónapjaAI

Kutatás

Egyszerű elvekkel javítják az AI-ügynökök teljesítményét az Amazon kutatói

Az Amazon kutatói kidolgoztak egy új AI-rendszert, amely csökkenti a modell szándéka és a végrehajtás közötti rést. Ez a technológia lehetővé teszi a fejlettebb kódszerkesztési feladatok hatékonyabb elvégzését.

Amazon Science·1 hónapjaAI

Kutatás

Nyílt forráskódú AI-képgenerátorok közelednek a zárt modellek minőségéhez

A nyílt forráskódú AI-képgenerátorok minősége jelentősen megközelítette a zárt modellekét. A nyílt modellek képességei már olyan szinten vannak, amely ellentmond a jelenlegi általános vélekedésnek.

Reddit ML·1 hónapjaAI

Kutatás

Az OpenAI 2028-ra AI-kutatókat vetne be a tudományos haladás felgyorsítására

2028 márciusára az AI rendszerek végezhetik a kutatások jelentős részét, segítve a tudományos haladást. Az AI-k párhuzamosan dolgoznak az emberi kutatókkal.

OpenAI·1 hónapjaAI

Kutatás

Új AI-kutatói programot indít az OpenAI — 2026. július 5-ig lehet pályázni

Az OpenAI Economic Research Exchange nevű programjára július 5-ig lehet pályázni. A kiválasztott kutatók projektalapú együttműködésben vizsgálhatják az AI hatásait a munkavállalókra, cégekre és a gazdaságra.

OpenAI·1 hónapjaAI

Kutatás

Az Anthropic filozófusát a Claude AI leválthatja

A Claude AI hamarosan felülmúlhatja az Anthropic filozófusát, és átveheti a munkáját. A modell a filozófiai és igazítási munkában is jobb lesz.

Anthropic·1 hónapjaAI

Kutatás

Az AI 1000-szer gyorsabban segíti az időjárás-előrejelzést, mint a hagyományos módszerek

2025 februárjában az ECMWF bevezette gépi tanuláson alapuló modelljét, amely felgyorsítja az időjárás-előrejelzést. A modell az időjárás-előrejelzési folyamatot jelentősen lerövidíti.

Ars Technica·1 hónapjaAI

Kutatás

Mireia Yurrita kapta a legjobb kutatás díját

A 25. AAMAS 2026 konferencián május 25-29. között adták át a díjat. A kutatás az ember-LLM ügynökcsapatok irányelveit vizsgálta.

Robohub·1 hónapjaAI

Kutatás

Újságírókat alkalmaz az AI-cégek a mesterséges intelligencia fejlesztésére

Az AI-cégek, köztük a Meta és az xAI, újságírókat alkalmaznak a mesterséges intelligencia modellek fejlesztésére. A cél a természetes és érthető szöveg generálása.

AI for Newsroom·1 hónapjaAI

Kutatás

Új AI-rendszer menti meg a robotokat a hibáktól — 10%-kal több feladatot végeznek el

Az AEGIS nevű új módszer 10,1%-kal több feladatot végez el sikeresen a robotoknál, mint a korábbi eljárások. A rendszer a hibák láthatóvá válása előtt kapcsol át egy erősebb vezérlőre.

ArXiv AI·1 hónapjaAI

Kutatás

Kétféleképpen hibázhatnak a nyelvi modellek: token-szintű bizonytalanság jelzi a bajt

A nyelvi modellek érvelési hibái kétféle folyamaton keresztül keletkeznek, amelyeket token-szintű bizonytalanság jelez. Az új keretrendszer 23 tesztelt konfigurációból 20 esetben pontosan előre jelezte a hibákat.

ArXiv NLP·1 hónapjaAI

Kutatás

Moduláris megközelítéssel javítják az AI-modellek teljesítményét alacsony erőforrású nyelveken

A moduláris adaptáció javítja a nyelvi modellek teljesítményét ritka nyelveken, mint az ír, a skót gael és a kecsua. Az új módszer kevesebb számítási kapacitást igényel, mint a teljes átfinomítás.

ArXiv NLP·1 hónapjaAI

Kutatás

Új MacArena teljesítményteszt teszteli a macOS-es AI-ügynököket — 26%-os különbség a modellek között

Az új MacArena teljesítményteszt 421 feladattal teszteli az Apple Siliconon futó AI-ügynököket, feltárva a macOS-specifikus kihívásokat. A modellek teljesítménye jelentősen eltérhet a natív és a portolt feladatok között.

ArXiv ML·1 hónapjaAI

Kutatás

A FMScope diagnosztizálja az azonosítócsapdát az EEG-alapmodellekben

Az EEG-alapú mesterséges intelligenciák pontossága félrevezető lehet, mivel gyakran az alanyok egyedi jellemzőit azonosítják a valós biológiai markerek helyett. A FMScope protokoll képes diagnosztizálni ezt a 'identitáscsapdát' még a finomhangolás előtt.

ArXiv ML·1 hónapjaAI

Kutatás

Már csak 8,2%-ban gondolkodik mélyen az új AI-módszer, de pontosabb

Az IDPR keretrendszer a válaszok pontosságát 47,90%-ról 48,92%-ra növeli, miközben a lassú érvelést csak az esetek 8,20%-ában hívja elő. Ezzel jelentősen csökkenti a számítási költségeket.

ArXiv NLP·1 hónapjaAI

Kutatás

A Geometric Account of Activation Steering through Angle-Norm Decomposition

A nyelvi modellek viselkedése 10%-os pontossággal irányítható. A fogalmak szögletes szerkezetben reprezentálódnak a modellekben.

ArXiv AI·1 hónapjaAI