ÉlőUtoljára: 3 perceMa: 8

Rovat · 4. oldal

Kutatás

AI research papers, arXiv publikációk, benchmarkok, tudományos áttörések

805 cikk az archívumban

10. ABAW workshop: komplex viselkedéselemzés és érzelmi mintázatok kerültek a középpontba
Kutatás

10. ABAW workshop: komplex viselkedéselemzés és érzelmi mintázatok kerültek a középpontba

A CVPR 2026 keretében megrendezett 10. ABAW workshopon a kutatók a valós idejű, komplex emberi viselkedés és érzelmek AI-alapú modellezésére fókuszáltak.

ArXiv CV·AI
Quebeci francia nyelvet és kultúrát tanítják az AI-nak a Cohere és a Mila kutatásai
Kutatás

Quebeci francia nyelvet és kultúrát tanítják az AI-nak a Cohere és a Mila kutatásai

A Cohere és a Mila kutatási együttműködést indít a Quebeci Franciaország nyelvi és kulturális kontextusának AI-ban való jobb megjelenítéséért.

Cohere·AI
Önállóan tervező AI-rendszer hoz áttörést a hálózati anomáliák felderítésében
Kutatás

Önállóan tervező AI-rendszer hoz áttörést a hálózati anomáliák felderítésében

Az új SignGAD AI-eljárás önállóan tervez munkafolyamatokat a hálózati anomáliák kevés adattal történő felderítésére, legyőzve a korábbi módszereket.

ArXiv ML·AI
ScientistOne: Az AI-kutató már most ellenőrizhető bizonyítékokkal dolgozik
Kutatás

ScientistOne: Az AI-kutató már most ellenőrizhető bizonyítékokkal dolgozik

A ScientistOne nevű új AI-rendszer a kutatás minden lépését dokumentálja, hogy elkerülje a hamisított hivatkozásokat és az ellenőrizhetetlen eredményeket.

ArXiv AI·AI
Maksim Ivanov és csapata bemutatja az Anchor rendszert
Kutatás

Maksim Ivanov és csapata bemutatja az Anchor rendszert

Az Anchor nevű új generátor egységes specifikációból hoz létre természetes nyelvű utasításokat, környezeteket és ellenőrzőket, kiküszöbölve a korábbi módszerek hibáit.

ArXiv AI·AI
A YouTube-említések biztosítják a legerősebb láthatóságot az AI-keresési eredményekben — derül ki az Ahrefs kutatásából
Kutatás

A YouTube-említések biztosítják a legerősebb láthatóságot az AI-keresési eredményekben — derül ki az Ahrefs kutatásából

Az Ahrefs 75 ezer márkát vizsgált, és megállapította, hogy a YouTube-említések a legfontosabb tényezők az AI-generált keresési eredményekben való megjelenéshez. Ez a jelenség több platformon, például a ChatGPT-n és a Google AI-alapú szolgáltatásain is megfigyelhető.

TNW·AI
Utazási márkák láthatósága: Új index rangsorolja a légitársaságokat és szállodákat az AI-ban
Kutatás

Utazási márkák láthatósága: Új index rangsorolja a légitársaságokat és szállodákat az AI-ban

A 5W Public Relations új indexe először méri, hogy a ChatGPT, Claude, Perplexity és a Google AI Overviews milyen gyakran idézik a légitársaságok és szállodák márkáit.

Perplexity·AI
Új AI-rendszer segíti a robotok együttműködését városi környezetben
Kutatás

Új AI-rendszer segíti a robotok együttműködését városi környezetben

A CoSaR keretrendszer lehetővé teszi a robotok számára, hogy természetes nyelven egyeztessenek találkozási pontot, miközben elkerülik az őrjáratokat.

ArXiv CV·AI
A LongAV-Compass 284 tesztesetet tartalmaz az audio-vizuális generáció értékeléséhez
Kutatás

A LongAV-Compass 284 tesztesetet tartalmaz az audio-vizuális generáció értékeléséhez

A perces AI-videók minőségét mostantól egységesen méri a LongAV-Compass, amely 284 tesztesetet tartalmaz a szövegből, képből és videóból generált tartalmakhoz.

ArXiv CV·AI
Filozófusokat alkalmaz az OpenAI és a Google
Kutatás

Filozófusokat alkalmaz az OpenAI és a Google

A mesterséges intelligencia fejlesztésében az OpenAI és a Google is filozófusokat vesz fel. A WIRED szerint a két cég legalább 14 filozófust alkalmaz.

Wired·AI
Új keretrendszer 300 szituációval térképezi a LLM-ek kulturális értékeit
Kutatás

Új keretrendszer 300 szituációval térképezi a LLM-ek kulturális értékeit

A preprint szerzői egy olyan keretrendszert mutatnak be, amely a World Values Survey helyett 300 szituációs dilemmát alkalmaz a LLM-ek rejtett kulturális dimenzióinak feltérképezésére.

ArXiv NLP·AI
LLM‑ek hallucinációi most már könnyebben kiszűrhetők a FEPoID‑vel
Kutatás

LLM‑ek hallucinációi most már könnyebben kiszűrhetők a FEPoID‑vel

Az új FEPoID kritérium automatikusan kiválasztja a legerősebb köztes rétegeket, ahol a hallucinációs jelek leginkább megjelennek, ezzel felülmúlva a korábbi, gyakran hibás layer‑választási módszereket.

ArXiv AI·AI
GEM új adatkeverési módszerrel 1,1B paraméteres modellek teljesítményét javítja
Kutatás

GEM új adatkeverési módszerrel 1,1B paraméteres modellek teljesítményét javítja

A LLM-ek előtanulásának hatékonyságát egyre inkább az adatösszetétel, nem a mennyiség határozza meg, és a GEM ezt a problémát célozza meg.

ArXiv ML·AI
GPT-5 mini a legjobb eredményt érte el az új 1 400 fordulós teljesítményteszten
Kutatás

GPT-5 mini a legjobb eredményt érte el az új 1 400 fordulós teljesítményteszten

Az új teljesítményteszt 300 vállalati szekciót és 1 400 lekérdezést tartalmaz, hogy tesztelje a többfordulós Text-to-SQL memóriakezelést.

ArXiv NLP·AI
Claude Mythos megoldotta a 1946‑os Erdős egység‑távolság tételt
Kutatás

Claude Mythos megoldotta a 1946‑os Erdős egység‑távolság tételt

A Claude Mythos egy izolált Claude Code példányokból álló tesztrendszerrel oldotta meg a 1946-os Erdős egység-távolság tételt. A megoldás során a példányok kidolgozták a megoldási útvonalakat, majd egy példány összegzi és továbbadta a többi egységnek.

The Decoder·AI
Rotman: 30%-os csökkenés
Kutatás

Rotman: 30%-os csökkenés

David Rotman, a MIT Technology Review szerkesztője szerint a junior pozíciókban 30%-os csökkenés tapasztalható az AI hatására, mely főként a fiatal munkavállalókat érinti.

MIT Technology Review·AI
EchoDistill javítja a zajos audio LLM-ek pontosságát valós időben
Kutatás

EchoDistill javítja a zajos audio LLM-ek pontosságát valós időben

Az EchoDistill egy ön‑diszszillációs megközelítést vezet be, amely egy fagyasztott tiszta‑audio tanár segítségével növeli a zajos audio LLM-ek megbízhatóságát.

ArXiv NLP·AI
Agentic AI: 3 határstratégiát definiál
Kutatás

Agentic AI: 3 határstratégiát definiál

A végrehajtási és felelősségi határok együtt mozdulhatnak, ha a verification költség és a felelősség átruházhatósága megfelelő. Az AI-támogatott képességek gyakran megőrzik az integrált felelősségi határokat.

ArXiv AI·AI
Az A-LEMS öt rétegű folyamat‑jával mérik az energiafelhasználást célonként
Kutatás

Az A-LEMS öt rétegű folyamat‑jával mérik az energiafelhasználást célonként

Az új mérőszám lehetővé teszi, hogy a több lépéses AI feladatok energiaigényét a sikeres célok alapján számolják.

ArXiv AI·AI
A Deterministic Horizon 19‑31 közötti értékkel határozza meg a pontosság plafont
Kutatás

A Deterministic Horizon 19‑31 közötti értékkel határozza meg a pontosság plafont

A transformer-architektúra kritikus mélysége után a pontosság már nem javul, függetlenül a tanítási adatmennyiségtől, az adapter rangjától vagy a veszteségfüggvénytől. A pontosság plafonját a Deterministic Horizon 19-31 közötti értékkel határozza meg.

ArXiv AI·AI
Gemini 2.5 Flash 21,13%-os hibával felülmúlja a GPT modelleket Slack‑tudásbecslésben
Kutatás

Gemini 2.5 Flash 21,13%-os hibával felülmúlja a GPT modelleket Slack‑tudásbecslésben

A kutatók azt mutatták, hogy a nagy nyelvi modellek képesek a munkavállalók szakértelmét becsülni több tízezer Slack‑üzenet elemzésével, és a Gemini 2.5 Flash a legkisebb hibát érte el.

ArXiv NLP·AI

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom