Rovat · 21. oldal

Kutatás

AI research papers, arXiv publikációk, benchmarkok, tudományos áttörések

1159 cikk az archívumban

FLUID: GPT-modelleket adaptál a diffúziós generáláshoz a Stanford kutatói

A Stanford és a Google Robotics kutatói bemutatták a FLUID nevű keretrendszert, amely lehetővé teszi a meglévő GPT-stílusú modellek hatékony adaptálását diffúziós szöveggeneráláshoz.

ArXiv NLP·2 hónapjaAI

Kutatás

10. ABAW workshop: komplex viselkedéselemzés és érzelmi mintázatok kerültek a középpontba

A CVPR 2026 keretében megrendezett 10. ABAW workshopon a kutatók a valós idejű, komplex emberi viselkedés és érzelmek AI-alapú modellezésére fókuszáltak.

ArXiv CV·2 hónapjaAI

Kutatás

Quebeci francia nyelvet és kultúrát tanítják az AI-nak a Cohere és a Mila kutatásai

A Cohere és a Mila kutatási együttműködést indít a Quebeci Franciaország nyelvi és kulturális kontextusának AI-ban való jobb megjelenítéséért.

Cohere·2 hónapjaAI

Kutatás

Önállóan tervező AI-rendszer hoz áttörést a hálózati anomáliák felderítésében

Az új SignGAD AI-eljárás önállóan tervez munkafolyamatokat a hálózati anomáliák kevés adattal történő felderítésére, legyőzve a korábbi módszereket.

ArXiv ML·2 hónapjaAI

Kutatás

ScientistOne: Az AI-kutató már most ellenőrizhető bizonyítékokkal dolgozik

A ScientistOne nevű új AI-rendszer a kutatás minden lépését dokumentálja, hogy elkerülje a hamisított hivatkozásokat és az ellenőrizhetetlen eredményeket.

ArXiv AI·2 hónapjaAI

Kutatás

Maksim Ivanov és csapata bemutatja az Anchor rendszert

Az Anchor nevű új generátor egységes specifikációból hoz létre természetes nyelvű utasításokat, környezeteket és ellenőrzőket, kiküszöbölve a korábbi módszerek hibáit.

ArXiv AI·2 hónapjaAI

Kutatás

A YouTube-említések biztosítják a legerősebb láthatóságot az AI-keresési eredményekben — derül ki az Ahrefs kutatásából

Az Ahrefs 75 ezer márkát vizsgált, és megállapította, hogy a YouTube-említések a legfontosabb tényezők az AI-generált keresési eredményekben való megjelenéshez. Ez a jelenség több platformon, például a ChatGPT-n és a Google AI-alapú szolgáltatásain is megfigyelhető.

TNW·2 hónapjaAI

Kutatás

Utazási márkák láthatósága: Új index rangsorolja a légitársaságokat és szállodákat az AI-ban

A 5W Public Relations új indexe először méri, hogy a ChatGPT, Claude, Perplexity és a Google AI Overviews milyen gyakran idézik a légitársaságok és szállodák márkáit.

Perplexity·2 hónapjaAI

Kutatás

Új AI-rendszer segíti a robotok együttműködését városi környezetben

A CoSaR keretrendszer lehetővé teszi a robotok számára, hogy természetes nyelven egyeztessenek találkozási pontot, miközben elkerülik az őrjáratokat.

ArXiv CV·2 hónapjaAI

Kutatás

A LongAV-Compass 284 tesztesetet tartalmaz az audio-vizuális generáció értékeléséhez

A perces AI-videók minőségét mostantól egységesen méri a LongAV-Compass, amely 284 tesztesetet tartalmaz a szövegből, képből és videóból generált tartalmakhoz.

ArXiv CV·2 hónapjaAI

Kutatás

Filozófusokat alkalmaz az OpenAI és a Google

A mesterséges intelligencia fejlesztésében az OpenAI és a Google is filozófusokat vesz fel. A WIRED szerint a két cég legalább 14 filozófust alkalmaz.

Wired·2 hónapjaAI

Kutatás

Új keretrendszer 300 szituációval térképezi az LLM-ek kulturális értékeit

A preprint szerzői egy olyan keretrendszert mutatnak be, amely a World Values Survey helyett 300 szituációs dilemmát alkalmaz az LLM-ek rejtett kulturális dimenzióinak feltérképezésére.

ArXiv NLP·2 hónapjaAI

Kutatás

LLM‑ek hallucinációi most már könnyebben kiszűrhetők a FEPoID‑vel

Az új FEPoID kritérium automatikusan kiválasztja a legerősebb köztes rétegeket, ahol a hallucinációs jelek leginkább megjelennek, ezzel felülmúlva a korábbi, gyakran hibás layer‑választási módszereket.

ArXiv AI·2 hónapjaAI

Kutatás

GEM új adatkeverési módszerrel 1,1B paraméteres modellek teljesítményét javítja

Az LLM-ek előtanulásának hatékonyságát egyre inkább az adatösszetétel, nem a mennyiség határozza meg, és a GEM ezt a problémát célozza meg.

ArXiv ML·2 hónapjaAI

Kutatás

GPT-5 mini a legjobb eredményt érte el az új 1 400 fordulós teljesítményteszten

Az új teljesítményteszt 300 vállalati szekciót és 1 400 lekérdezést tartalmaz, hogy tesztelje a többfordulós Text-to-SQL memóriakezelést.

ArXiv NLP·2 hónapjaAI

Kutatás

Rotman: 30%-os csökkenés

David Rotman, a MIT Technology Review szerkesztője szerint a junior pozíciókban 30%-os csökkenés tapasztalható az AI hatására, mely főként a fiatal munkavállalókat érinti.

MIT Technology Review·2 hónapjaAI

Kutatás

EchoDistill javítja a zajos audio LLM-ek pontosságát valós időben

Az EchoDistill egy ön‑diszszillációs megközelítést vezet be, amely egy fagyasztott tiszta‑audio tanár segítségével növeli a zajos audio LLM-ek megbízhatóságát.

ArXiv NLP·2 hónapjaAI

Kutatás

Agentic AI: 3 határstratégiát definiál

A végrehajtási és felelősségi határok együtt mozdulhatnak, ha a verification költség és a felelősség átruházhatósága megfelelő. Az AI-támogatott képességek gyakran megőrzik az integrált felelősségi határokat.

ArXiv AI·2 hónapjaAI

Kutatás

Az A-LEMS öt rétegű folyamat‑jával mérik az energiafelhasználást célonként

Az új mérőszám lehetővé teszi, hogy a több lépéses AI feladatok energiaigényét a sikeres célok alapján számolják.

ArXiv AI·2 hónapjaAI

Kutatás

A Deterministic Horizon 19‑31 közötti értékkel határozza meg a pontosság plafont

A transformer-architektúra kritikus mélysége után a pontosság már nem javul, függetlenül a tanítási adatmennyiségtől, az adapter rangjától vagy a veszteségfüggvénytől. A pontosság plafonját a Deterministic Horizon 19-31 közötti értékkel határozza meg.

ArXiv AI·2 hónapjaAI

Kutatás

Gemini 2.5 Flash 21,13%-os hibával felülmúlja a GPT modelleket Slack‑tudásbecslésben

A kutatók azt mutatták, hogy a nagy nyelvi modellek képesek a munkavállalók szakértelmét becsülni több tízezer Slack‑üzenet elemzésével, és a Gemini 2.5 Flash a legkisebb hibát érte el.

ArXiv NLP·2 hónapjaAI

Kutatás

FLUID: GPT-modelleket adaptál a diffúziós generáláshoz a Stanford kutatói

10. ABAW workshop: komplex viselkedéselemzés és érzelmi mintázatok kerültek a középpontba

Quebeci francia nyelvet és kultúrát tanítják az AI-nak a Cohere és a Mila kutatásai

Önállóan tervező AI-rendszer hoz áttörést a hálózati anomáliák felderítésében

ScientistOne: Az AI-kutató már most ellenőrizhető bizonyítékokkal dolgozik

Maksim Ivanov és csapata bemutatja az Anchor rendszert

A YouTube-említések biztosítják a legerősebb láthatóságot az AI-keresési eredményekben — derül ki az Ahrefs kutatásából

Utazási márkák láthatósága: Új index rangsorolja a légitársaságokat és szállodákat az AI-ban

Új AI-rendszer segíti a robotok együttműködését városi környezetben

A LongAV-Compass 284 tesztesetet tartalmaz az audio-vizuális generáció értékeléséhez

Filozófusokat alkalmaz az OpenAI és a Google

Új keretrendszer 300 szituációval térképezi az LLM-ek kulturális értékeit

LLM‑ek hallucinációi most már könnyebben kiszűrhetők a FEPoID‑vel

GEM új adatkeverési módszerrel 1,1B paraméteres modellek teljesítményét javítja

GPT-5 mini a legjobb eredményt érte el az új 1 400 fordulós teljesítményteszten

Rotman: 30%-os csökkenés

EchoDistill javítja a zajos audio LLM-ek pontosságát valós időben

Agentic AI: 3 határstratégiát definiál

Az A-LEMS öt rétegű folyamat‑jával mérik az energiafelhasználást célonként

A Deterministic Horizon 19‑31 közötti értékkel határozza meg a pontosság plafont

Gemini 2.5 Flash 21,13%-os hibával felülmúlja a GPT modelleket Slack‑tudásbecslésben

GPT-5 mini a legjobb eredményt érte el az új 1 400 fordulós teljesítményteszten