ÉlőUtoljára: 3 órájaMa: 26

Rovat · 22. oldal

Kutatás

AI research papers, arXiv publikációk, benchmarkok, tudományos áttörések

813 cikk az archívumban

Megfeleződött az amerikai programozói állások növekedése a ChatGPT óta
Kutatás

Megfeleződött az amerikai programozói állások növekedése a ChatGPT óta

A 2022 novemberi megjelenés előtt a programozói munkák évente közel 5 százalékkal bővültek, ami azóta drasztikusan lelassult.

The Decoder·AI
Nick Diakopoulos: Az AI elszámoltathatóság felé tolódik
Kutatás

Nick Diakopoulos: Az AI elszámoltathatóság felé tolódik

Az AI-rendszerek magyarázhatósága eddig főleg a technikai megértésre koncentrált, de a jövőben az elszámoltathatóság lesz a kulcs. Egy AI-rendszer által okozott kár esetén a felelős személyektől elvárható, hogy magyarázatot adjanak.

AI for Newsroom·AI
Új AI-módszer osztja el adaptívan a számítási kapacitást — jobb eredményekkel
Kutatás

Új AI-módszer osztja el adaptívan a számítási kapacitást — jobb eredményekkel

A keretrendszer a tesztidőben alakítja a generálási folyamatot és a számítási erőforrások elosztását, így a modellek hatékonyabban oldhatják meg a komplex feladatokat.

ArXiv AI·AI
AI-alapú hadműveleti tervezés: a jövő hadviselésének kulcsa az automatizálás
Kutatás

AI-alapú hadműveleti tervezés: a jövő hadviselésének kulcsa az automatizálás

A manőverezési sebesség, a felderítési és fegyverhatótávolságok növekedése miatt a hagyományos, emberi alapú tervezés egyre nehezebbé válik a modern hadszíntéren.

ArXiv AI·AI
HypEHR: Hiperbolikus modell válaszol orvosi kérdésekre – kevesebb paraméterrel
Kutatás

HypEHR: Hiperbolikus modell válaszol orvosi kérdésekre – kevesebb paraméterrel

A modell a klinikai adatok hierarchikus szerkezetét használja ki, ami költséghatékonyabb megoldást kínál az elektronikus egészségügyi nyilvántartások (EHR) lekérdezésére.

ArXiv AI·AI
12 tényező befolyásolja az LLM-ek viselkedését
Kutatás

12 tényező befolyásolja az LLM-ek viselkedését

A nagyméretű nyelvi modellek viselkedését 12 környezeti tényező befolyásolja. A kutatók új módszert dolgoztak ki ennek mérésére.

ArXiv AI·AI
Egyetlen AI sem végez banki munkát ügyfélre készen — 500 bankár szerint
Kutatás

Egyetlen AI sem végez banki munkát ügyfélre készen — 500 bankár szerint

A vezető AI modellek, mint a GPT-5.4 és a Claude Opus 4.6, nem képesek önállóan, ügyfélnek küldhető minőségű munkát produkálni a befektetési banki feladatokban — derül ki egy új benchmarkból.

The Decoder·AI
COMPASS nevű rendszerrel automatizálja a promptmérnökséget az ArXiv AI
Kutatás

COMPASS nevű rendszerrel automatizálja a promptmérnökséget az ArXiv AI

A rendszer a promptmérnökséget kognitív és valószínűségi döntéshozatali folyamatként kezeli, figyelembe véve a felhasználók rejtett kognitív állapotait.

ArXiv AI·AI
Automatizálja az AI-ügynökök finomhangolását az új keretrendszer
Kutatás

Automatizálja az AI-ügynökök finomhangolását az új keretrendszer

A rendszer az utasítások, eszközök és logikák tervezését is önállóan végzi, ami jelentősen felgyorsíthatja a domain-specifikus munkafolyamatok bevezetését.

ArXiv AI·AI
Pénzügyi kutatásban gyengén teljesít az AI — mutatja a Deep FinResearch Bench
Kutatás

Pénzügyi kutatásban gyengén teljesít az AI — mutatja a Deep FinResearch Bench

A Deep FinResearch Bench három dimenzióban vizsgálta a jelentések minőségét: a minőségi szigor, a mennyiségi előrejelzés pontossága és az állítások hitelessége.

ArXiv AI·AI
Az AI ügynökök nem helyettesítik, hanem kibővítik a szoftverfejlesztést a kódoláson túl
Kutatás

Az AI ügynökök nem helyettesítik, hanem kibővítik a szoftverfejlesztést a kódoláson túl

A mesterséges intelligencia rendszerek új, úgynevezett 'félig végrehajtható műtermékekkel' – mint az utasítások és munkafolyamatok – bővítik a szoftverfejlesztés hatókörét.

The Decoder·AI
Az AI ügynökök valós képességeit a SWE-bench Verified méri a legjobban
Kutatás

Az AI ügynökök valós képességeit a SWE-bench Verified méri a legjobban

A hagyományos perplexitás-pontszámok és MMLU ranglisták kevés információt adnak arról, hogy egy modell képes-e valós weboldalon navigálni vagy GitHub-problémát megoldani.

MarkTechPost·AI
Új mérőszám a szabályalapú AI értékelésére: a Defensibility Index
Kutatás

Új mérőszám a szabályalapú AI értékelésére: a Defensibility Index

A hagyományos értékelési módszerek gyakran tévesen büntetik a logikailag helyes, de eltérő döntéseket, amit a kutatók "Megállapodási Csapdának" neveznek.

ArXiv AI·AI
COSPLAY: Új keretrendszer javítja a LLM-ek hosszú távú döntéshozatalát
Kutatás

COSPLAY: Új keretrendszer javítja a LLM-ek hosszú távú döntéshozatalát

A keretrendszerben egy LLM döntéshozó ügynök egy tanulható készségbankból hív le tudást, miközben egy másik ügynök új, újrafelhasználható készségeket fedez fel a modell futásaiból.

ArXiv AI·AI
Multi-Objective RL-lel tervez új gyógyszerjelölteket az ArXiv tanulmánya
Kutatás

Multi-Objective RL-lel tervez új gyógyszerjelölteket az ArXiv tanulmánya

A kutatók az epidermális növekedési faktor receptor (EGFR) és az acetilkolin-észteráz (ACHE) célfehérjékre alkalmazták a módszert, ígéretes eredményekkel.

ArXiv ML·AI
Gépi tanulás segíthet csökkenteni a cementgyártás légszennyezését
Kutatás

Gépi tanulás segíthet csökkenteni a cementgyártás légszennyezését

A cementgyártás évente körülbelül 3 millió tonna nitrogén-oxidot bocsát ki, ami az ipari légszennyezés egyik legnagyobb forrása.

ArXiv ML·AI
Az Anthropic szerint az erősebb AI jobb üzleteket köt, a vesztesek észre sem veszik
Kutatás

Az Anthropic szerint az erősebb AI jobb üzleteket köt, a vesztesek észre sem veszik

Az Anthropic „Project Deal” kísérletében a Claude Opus modell átlagosan két további üzletet zárt, mint a Haiku felhasználók, és jelentősen jobb árakat alkudott ki.

The Decoder·AI
64-szeres tömörítéssel gyorsítja a mozgásgenerálást az Apple új AI-ja
Kutatás

64-szeres tömörítéssel gyorsítja a mozgásgenerálást az Apple új AI-ja

A modell a nagyméretű mozgáspályákból tanult, tömörített mozgás-embeddingekkel dolgozik, így sokkal hatékonyabban modellezi a jelenetdinamikát.

Apple ML·AI
AI-rendszer elemzi a diákok érvelését — automatizálja az osztálytermi diskurzust
Kutatás

AI-rendszer elemzi a diákok érvelését — automatizálja az osztálytermi diskurzust

Az új rendszer a tanárok és diákok megnyilvánulásait két dimenzió mentén osztályozza, ezzel felgyorsítva a tudáskonstrukció megértését.

ArXiv NLP·AI
Nem általánosítható a hallucináció a LLM-ekben — domain-specifikus a jelenség
Kutatás

Nem általánosítható a hallucináció a LLM-ekben — domain-specifikus a jelenség

A korábbi kutatások által azonosított, a hallucinációkat előrejelző neuronok nem működnek más területeken, ami megnehezíti a jelenség univerzális kezelését.

ArXiv NLP·AI
Új ToolsRL keretrendszerrel javul a vizuális érvelés a LLM-eknél
Kutatás

Új ToolsRL keretrendszerrel javul a vizuális érvelés a LLM-eknél

A ToolsRL keretrendszer kétlépcsős megerősítéses tanulási (RL) folyamatot alkalmaz, amelyben a modellek először az eszközhasználatot sajátítják el, majd a vizuális érvelési feladatokat.

ArXiv CV·AI

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom