
10. ABAW workshop: komplex viselkedéselemzés és érzelmi mintázatok kerültek a középpontba
A CVPR 2026 keretében megrendezett 10. ABAW workshopon a kutatók a valós idejű, komplex emberi viselkedés és érzelmek AI-alapú modellezésére fókuszáltak.
AI research papers, arXiv publikációk, benchmarkok, tudományos áttörések

A CVPR 2026 keretében megrendezett 10. ABAW workshopon a kutatók a valós idejű, komplex emberi viselkedés és érzelmek AI-alapú modellezésére fókuszáltak.

A Cohere és a Mila kutatási együttműködést indít a Quebeci Franciaország nyelvi és kulturális kontextusának AI-ban való jobb megjelenítéséért.

Az új SignGAD AI-eljárás önállóan tervez munkafolyamatokat a hálózati anomáliák kevés adattal történő felderítésére, legyőzve a korábbi módszereket.

A ScientistOne nevű új AI-rendszer a kutatás minden lépését dokumentálja, hogy elkerülje a hamisított hivatkozásokat és az ellenőrizhetetlen eredményeket.

Az Anchor nevű új generátor egységes specifikációból hoz létre természetes nyelvű utasításokat, környezeteket és ellenőrzőket, kiküszöbölve a korábbi módszerek hibáit.

Az Ahrefs 75 ezer márkát vizsgált, és megállapította, hogy a YouTube-említések a legfontosabb tényezők az AI-generált keresési eredményekben való megjelenéshez. Ez a jelenség több platformon, például a ChatGPT-n és a Google AI-alapú szolgáltatásain is megfigyelhető.

A 5W Public Relations új indexe először méri, hogy a ChatGPT, Claude, Perplexity és a Google AI Overviews milyen gyakran idézik a légitársaságok és szállodák márkáit.

A CoSaR keretrendszer lehetővé teszi a robotok számára, hogy természetes nyelven egyeztessenek találkozási pontot, miközben elkerülik az őrjáratokat.

A perces AI-videók minőségét mostantól egységesen méri a LongAV-Compass, amely 284 tesztesetet tartalmaz a szövegből, képből és videóból generált tartalmakhoz.

A mesterséges intelligencia fejlesztésében az OpenAI és a Google is filozófusokat vesz fel. A WIRED szerint a két cég legalább 14 filozófust alkalmaz.

A preprint szerzői egy olyan keretrendszert mutatnak be, amely a World Values Survey helyett 300 szituációs dilemmát alkalmaz a LLM-ek rejtett kulturális dimenzióinak feltérképezésére.

Az új FEPoID kritérium automatikusan kiválasztja a legerősebb köztes rétegeket, ahol a hallucinációs jelek leginkább megjelennek, ezzel felülmúlva a korábbi, gyakran hibás layer‑választási módszereket.

A LLM-ek előtanulásának hatékonyságát egyre inkább az adatösszetétel, nem a mennyiség határozza meg, és a GEM ezt a problémát célozza meg.

Az új teljesítményteszt 300 vállalati szekciót és 1 400 lekérdezést tartalmaz, hogy tesztelje a többfordulós Text-to-SQL memóriakezelést.

A Claude Mythos egy izolált Claude Code példányokból álló tesztrendszerrel oldotta meg a 1946-os Erdős egység-távolság tételt. A megoldás során a példányok kidolgozták a megoldási útvonalakat, majd egy példány összegzi és továbbadta a többi egységnek.

David Rotman, a MIT Technology Review szerkesztője szerint a junior pozíciókban 30%-os csökkenés tapasztalható az AI hatására, mely főként a fiatal munkavállalókat érinti.

Az EchoDistill egy ön‑diszszillációs megközelítést vezet be, amely egy fagyasztott tiszta‑audio tanár segítségével növeli a zajos audio LLM-ek megbízhatóságát.

A végrehajtási és felelősségi határok együtt mozdulhatnak, ha a verification költség és a felelősség átruházhatósága megfelelő. Az AI-támogatott képességek gyakran megőrzik az integrált felelősségi határokat.

Az új mérőszám lehetővé teszi, hogy a több lépéses AI feladatok energiaigényét a sikeres célok alapján számolják.

A transformer-architektúra kritikus mélysége után a pontosság már nem javul, függetlenül a tanítási adatmennyiségtől, az adapter rangjától vagy a veszteségfüggvénytől. A pontosság plafonját a Deterministic Horizon 19-31 közötti értékkel határozza meg.

A kutatók azt mutatták, hogy a nagy nyelvi modellek képesek a munkavállalók szakértelmét becsülni több tízezer Slack‑üzenet elemzésével, és a Gemini 2.5 Flash a legkisebb hibát érte el.
Tetszik az oldal? Támogasd a fejlesztést
Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.