Rovat · 8. oldal

Kutatás

AI research papers, arXiv publikációk, benchmarkok, tudományos áttörések

1159 cikk az archívumban

Folyamatos tanuló AI segíti a szívritmuszavarok pontosabb feltárását

Az új cAPM módszer 4,5 szúrással 81% valószínűséggel azonosítja a szívritmuszavarok forrását, szemben a korábbi 13,7 szúrással.

ArXiv ML·1 hónapjaAI

Kutatás

Airbus fejleszti a repülők helyzetérzékelését kvantumszenzorokkal és AI-val

Az Airbus a Vivatech kiállításon mutatta be az Optimate demonstrátor projektet, amelyben radar, lidar, kamerák és AI kombinációját használják a helyzetfelismerés javítására. A cég a kvantumszenzorok fejlesztését is vizsgálja a repülési biztonság növelésére.

Euronews AI·1 hónapjaAI

Kutatás

Térbeli érvelésben verte az élvonalat az NVIDIA új, edzésmentes AI-ügynöke

Az NVIDIA SpatialClaw ügynöke kódként kezeli az utasításokat, és 59,9%-os átlagos pontossággal teljesít 20 teljesítményteszten, felülmúlva a korábbi modelleket.

MarkTechPost·1 hónapjaAI

Kutatás

LoRA dominál a Hugging Face-on, de más PEFT technikák is versenyezhetnek

Bár a Hugging Face Hubon található modellek 98,4%-az említi a LoRA-t, a kutatók szerint más paraméterhatékony finomhangolási (PEFT) technikák is felülmúlhatják bizonyos feladatokban.

Hugging Face·1 hónapjaAI

Kutatás

AI-használat csökkenti a szakemberek képességeit – lengyel kutatás szerint

Az AI-eszközök túlzott használata csökkentheti a szakemberek készségeit, ezt támasztja alá egy lengyel kutatás, amely szerint a sebészek adenóma-észlelési aránya 28,4%-ról 22,4%-ra esett vissza az AI-segédlet bevezetése után.

Hacker News·1 hónapjaAI

Kutatás

Nobel-díjas kutató, John Jumper az Anthropic-hoz igazol DeepMind-tól

Az AlphaFold-ot fejlesztő, 2024-ben kémiai Nobel-díjjal kitüntetett John Jumper kilenc év után hagyja el a Google DeepMind-ot, hogy riválisukhoz, az Anthropic-hoz csatlakozzon.

The Decoder·1 hónapjaAI

Kutatás

Az AI-modellek 3%-ban oldanak meg valós tudásmunka feladatokat

Az AA-Briefcase teljesítményteszt szerint a legfejlettebb AI-modellek is csak 3%-ban oldanak meg teljesen valós tudásmunka feladatokat, miközben az árkülönbség akár 800-szoros is lehet.

The Decoder·1 hónapjaAI

Kutatás

Matematikai áttöréssel gyorsít a Subquadratic a nagy nyelvi modelleken

A Subquadratic nevű startup azt állítja, hogy egy matematikai áttöréssel drasztikusan csökkentette a transformer-alapú AI-modellek válaszadásához szükséges számítások mennyiségét.

MIT Technology Review·1 hónapjaAI

Kutatás

DeFAb teljesítményteszt teszteli a kreativitást a nagy nyelvi modellekben

A kutatók több mint 372 000 példát és 33,75 millió anyagi szabályt gyűjtöttek össze a DeFAb benchmarkbe, amely 2026. június 19‑én jelent meg MIT licenc alatt.

ArXiv AI·1 hónapjaAI

Kutatás

Új teljesítményteszt méri, hogy az AI-ügynökök képesek-e hosszú távon is sikeresen vezetni egy céget

Az LLM-ügynökök a rövid távú feladatokban jeleskednek, de a hosszú távú, bizonytalan kihívásokkal meggyűlik a bajuk — ezt méri a Stanford és a Google Robotics új CEO-Bench benchmarkja.

ArXiv AI·1 hónapjaAI

Kutatás

Évek óta agyi implantátummal él a bénult férfi — új funkciókkal bővült a BCI

Casey Harrell, az ALS-ben szenvedő férfi, aki három éve használja agyi implantátumát, mostantól privát módban és profán filterrel kommunikálhat, miközben a BCI-kutatások világszerte fellendülőben vannak.

MIT Technology Review·1 hónapjaAI

Kutatás

Új módszerrel gyorsítják a diffúziós modellek optimalizálását kutatók

A kutatók által kifejlesztett prím-duális inferencia (PDI) módszer a diffúziós modellek mintavételezését teszi hatékonyabbá, különösen összetett optimalizálási feladatoknál.

ArXiv ML·1 hónapjaAI

Kutatás

Alapmodellek hatékonyan segítenek a rákdiagnosztikában

A vizsgálatok szerint az alapmodellek képesek megbízható eredményeket szolgáltatni különböző ráktípusok felismerésére, még akkor is, ha az adatok eloszlása eltér a tanítóhalmaztól.

ArXiv ML·1 hónapjaAI

Kutatás

Az Arbor új megközelítéssel 2,5-szer gyorsabb a Claude Code-nál

Az Arbor két fő komponensből áll: egy koordinátor‑ügynök, amely a kutatási irányt irányít, és több rövid életű végrehajtó‑ügynök, amelyek izolált környezetben tesztelik a hipotéziseket.

VentureBeat·1 hónapjaAI

Kutatás

Bebizonyítja egy Microsoft kutató, hogy az Age of Empires II-ben is építhető neurális hálózat

A kutató egy NAND kaput és egy 1‑bit perceptront épített a játék szcenárió‑szerkesztőjében, digitális kecskéket használva bitekként. Ez a kísérlet rávilágít a neurális hálózatok építésének lehetőségére egy váratlan környezetben.

404 Media·1 hónapjaAI

Kutatás

OpenAI 92%-os pontossággal jósolja meg a modellek hibaarányát

A hagyományos biztonsági tesztek csak a felhasználói kérdések egy szűk szeletét vizsgálták — az új telepítés Simulation módszer 1,3 millió valós, anonim beszélgetés alapján 92%-os hibaarány-előrejelzést ér el.

The Decoder·1 hónapjaAI

Kutatás

MIT és UPenn fejlesztett MIGHTY rendszert – 15 % gyorsabb drónútvonal

Az új MIGHTY rendszer lehetővé teszi, hogy a drónok ezredmásodpercenként reagáljanak hirtelen akadályokra, miközben 6,7 m/s sebességgel tartják a sima repülési pályát – ez kritikus a földrengés utáni mentési műveletekben.

Robohub·1 hónapjaAI

Kutatás

Bizonytalanságot mér az új módszer mágneses rezonanciás képalkotásban

Kutatók egy új Bayesian módszert fejlesztettek ki, amely megbecsüli a mágneses rezonancia képalkotás során keletkező hibák mértékét. Ez a módszer hatékonyabban képes kvantálni a képalkotás során keletkező hibákat.

ArXiv CV·1 hónapjaAI

Kutatás

A PhoneHarness 12,9 százalékponttal jobb a korábbi mobilügynöknél

A PhoneHarness 75%-os feladatvégrehajtási arányt ért el, ami 12,9 százalékponttal múlja felül a korábbi mobilügynököket. A PhoneHarness egy új keretrendszer, amely valós mobilfeladatok elvégzésére alkalmas ügynököket tesztel.

ArXiv NLP·1 hónapjaAI

Kutatás

Hajókat ismer fel 100%-os pontossággal a Vision Transformer modell

A Vision Transformer (ViT) modell 100%-os pontossággal és a leggyorsabb feldolgozási idővel ismerte fel a hajókat a tengeri képeken, felülmúlva a hagyományos CNN-modelleket.

ArXiv CV·1 hónapjaAI

Kutatás

32,5%-kal kevesebb adatot igényel az LLM-bírák megbízhatóságának becsléséhez a Metric Match

Az LLM-bírák megbízhatóságának becsléséhez szükséges emberi annotációk számát és költségét csökkenti a Metric Match nevű új módszer, amely 32,5%-kal kevesebb adatot igényel.

ArXiv AI·1 hónapjaAI

Kutatás

Folyamatos tanuló AI segíti a szívritmuszavarok pontosabb feltárását

Airbus fejleszti a repülők helyzetérzékelését kvantumszenzorokkal és AI-val

Térbeli érvelésben verte az élvonalat az NVIDIA új, edzésmentes AI-ügynöke

LoRA dominál a Hugging Face-on, de más PEFT technikák is versenyezhetnek

AI-használat csökkenti a szakemberek képességeit – lengyel kutatás szerint

Nobel-díjas kutató, John Jumper az Anthropic-hoz igazol DeepMind-tól

Az AI-modellek 3%-ban oldanak meg valós tudásmunka feladatokat

Matematikai áttöréssel gyorsít a Subquadratic a nagy nyelvi modelleken

DeFAb teljesítményteszt teszteli a kreativitást a nagy nyelvi modellekben

Új teljesítményteszt méri, hogy az AI-ügynökök képesek-e hosszú távon is sikeresen vezetni egy céget

Évek óta agyi implantátummal él a bénult férfi — új funkciókkal bővült a BCI

Új módszerrel gyorsítják a diffúziós modellek optimalizálását kutatók

Alapmodellek hatékonyan segítenek a rákdiagnosztikában

Az Arbor új megközelítéssel 2,5-szer gyorsabb a Claude Code-nál

Bebizonyítja egy Microsoft kutató, hogy az Age of Empires II-ben is építhető neurális hálózat

OpenAI 92%-os pontossággal jósolja meg a modellek hibaarányát

MIT és UPenn fejlesztett MIGHTY rendszert – 15 % gyorsabb drónútvonal

Bizonytalanságot mér az új módszer mágneses rezonanciás képalkotásban

A PhoneHarness 12,9 százalékponttal jobb a korábbi mobilügynöknél

Hajókat ismer fel 100%-os pontossággal a Vision Transformer modell

32,5%-kal kevesebb adatot igényel az LLM-bírák megbízhatóságának becsléséhez a Metric Match

MIT és UPenn fejlesztett MIGHTY rendszert – 15 % gyorsabb drónútvonal