Frissítve: 17 perce·Ma: 38

Kutatás

AI research papers, arXiv publikációk, benchmarkok, tudományos áttörések

50 cikk ebben a rovatban

3 cikk
7 cikk
A Databricks új AI-ügynöke 38%-kal veri a csúcsmodelleket hibrid lekérdezéseknél
KutatásAI

A Databricks új AI-ügynöke 38%-kal veri a csúcsmodelleket hibrid lekérdezéseknél

Ezzel a fejlesztéssel a Databricks lehetővé teszi a felhasználók számára, hogy hatékonyabban kezeljék a strukturált és strukturálatlan adatokat, és jobb eredményeket érjenek el a hibrid lekérdezések során.

VentureBeat
A Stanford AI Index 2026 szerint az AI már PhD-szintű kérdésekben is felülmúlja az embert
KutatásAI

A Stanford AI Index 2026 szerint az AI már PhD-szintű kérdésekben is felülmúlja az embert

Az AI-modellek már a PhD-szintű tudományos kérdésekben és a versenyképes matematikában is jobban teljesítenek, mint az ember. Ez az előrelépés egy év alatt következett be.

The Decoder
microgpt: Andrej Karpathy lecsupaszította a GPT-t, 200 sorban a lényeg
KutatásAI

microgpt: Andrej Karpathy lecsupaszította a GPT-t, 200 sorban a lényeg

Andrej Karpathy, a neves AI-kutató, egy mindössze 200 soros Python szkripttel tette közzé a microgpt-t, amely egy teljes GPT modell betanítására és következtetésére is képes.

Andrej Karpathy
Új AI modell jósolja meg az emberi mozgásokat egocentrikus videókból
KutatásAI

Új AI modell jósolja meg az emberi mozgásokat egocentrikus videókból

Egy új AI modell a teljes test mozgását figyelembe vevő, részletes akcióreprezentációt használ, ami jelentős lépést jelent a komplex valós környezetek és az emberi viselkedés modellezésében. A modell a múltbeli képkockák és a kívánt 3D pózváltozások alapján jósolja meg a következő videóképet.

BAIR Blog
Az Apple új keretrendszere 500 ezer szavas szótárral is FST-pontosságot ígér
KutatásAI

Az Apple új keretrendszere 500 ezer szavas szótárral is FST-pontosságot ígér

A keretrendszerrel a változó hosszúságú hang- vagy szöveges adatok fonetikai tartalmát rögzített dimenziós beágyazási térbe lehet leképezni.

Apple ML
100 önvezető autóval csökkentették a forgalmi dugókat a Berkeley kutatói
KutatásAI

100 önvezető autóval csökkentették a forgalmi dugókat a Berkeley kutatói

A Berkeley Egyetem kutatói 100 önvezető autót használtak csúcsforgalomban a torlódások csökkentésére. A kísérletben mesterséges intelligenciával vezérelt autók vettek részt, amelyek a 'stop-and-go' hullámokat célozták.

BAIR Blog
Új AI-módszer rangsorolja a döntési alternatívákat: kardinális és ordinális adatokkal is dolgozik
KutatásAI

Új AI-módszer rangsorolja a döntési alternatívákat: kardinális és ordinális adatokkal is dolgozik

A Multi-Criteria Analysis (MCA) módszereket kiegészítő új megközelítés a szubjektív torzításokat és az adatok sokféleségéből adódó pontatlanságokat igyekszik kiküszöbölni.

ArXiv AI
9 cikk
A Reddit szerint az AI rendszerek teljesítménymérése egyre bonyolultabb
KutatásAI

A Reddit szerint az AI rendszerek teljesítménymérése egyre bonyolultabb

Egy szakértői csoport szerint az AI modellek teljesítményének értékelése összetett mérnöki feladat, amely a szoftverfejlesztési feladatok komplexitásán alapul. A csoport egy diagramot publikált, amely az AI modelleket hasonlítja össze a feladatok komplexitása alapján.

Reddit ML
Új teljesítményteszt vizsgálja a LLM-ek tudásdriftjét, korlátokat tárt fel
KutatásAI

Új teljesítményteszt vizsgálja a LLM-ek tudásdriftjét, korlátokat tárt fel

A nagyméretű nyelvi modellek (LLM) betanításkor rögzített tudása folyamatosan elavul, ami kihívást jelent a valós idejű adaptációban.

ArXiv NLP
Mustafa Suleyman: az AI számítási teljesítménye 1000-szeresére nő 2028 végére
KutatásAI

Mustafa Suleyman: az AI számítási teljesítménye 1000-szeresére nő 2028 végére

A chipek hétszeres teljesítménynövekedése, a háromszoros memória-sávszélesség és a GPU-hálózatok együttes hatása hozza a fejlődést — az AI telepítési költségei éves szinten akár 900-szorosára csökkentek.

MIT Technology Review
Algebrai struktúrákkal csökkenti a keresési teret egy új optimalizálási keretrendszer
KutatásAI

Algebrai struktúrákkal csökkenti a keresési teret egy új optimalizálási keretrendszer

Kombinatorikus optimalizálási feladatok rejtett algebrai struktúrákat tartalmaznak, amelyek feltárása csökkenti a keresési teret. A módszer segítségével hatékonyabb megoldások érhetők el.

ArXiv AI
A QIMMA kiszűri a hibákat az arab nyelvi LLM-benchmarkingból
KutatásAI

A QIMMA kiszűri a hibákat az arab nyelvi LLM-benchmarkingból

Több mint 52 ezer mintát tartalmazó értékelési csomagot hozott létre a QIMMA, ezzel a meglévő arab nyelvi LLM-benchmarkingok hiányosságait orvosolja.

ArXiv NLP
A Memento-Skills maga írja át a saját képességeit, nem kell betanítani
KutatásAI

A Memento-Skills maga írja át a saját képességeit, nem kell betanítani

A több egyetem kutatói által fejlesztett Memento-Skills rendszer a GAIA teljesítményteszt során 13,7 százalékponttal javította a teszteredmények pontosságát egy statikus alapmodellhez képest.

VentureBeat
Új AI-módszer javítja a klinikai diagnózist: figyelembe veszi a bizonytalanságot
KutatásAI

Új AI-módszer javítja a klinikai diagnózist: figyelembe veszi a bizonytalanságot

A módszer egy tervező és egy diagnosztikai LLM-ügynökön keresztül kezeli a bizonytalanságot, képes a szekvenciális adatgyűjtést modellezni.

ArXiv AI
Új teszt kerüli meg a LLM-ek korlátját a telekommunikációban
KutatásAI

Új teszt kerüli meg a LLM-ek korlátját a telekommunikációban

A TelcoAgent-Bench nevű keretrendszer nem csupán a nyelvi megértést méri, hanem a strukturált hibaelhárítási folyamatokkal való összehangolást és a forgatókönyv-változatok stabilitását is értékeli.

ArXiv NLP
Az AI chatbotok homogenizálják gondolkodásunkat, csökkentve a kollektív bölcsességet
KutatásAI

Az AI chatbotok homogenizálják gondolkodásunkat, csökkentve a kollektív bölcsességet

Egy USC-tanulmány szerint a chatbotok egységesítik az írás stílusát és az érvelési stratégiákat — a kutatók több valós diverzitást sürgetnek a betanítási adatokban.

Hacker News
14 cikk
Az OSGym 90%-kal olcsóbbá teszi az AI ügynökök képzését
KutatásAI

Az OSGym 90%-kal olcsóbbá teszi az AI ügynökök képzését

A MIT, UIUC, CMU és UC Berkeley kutatói által fejlesztett OSGym keretrendszer egyidejűleg több mint ezer virtuális asztalt képes kezelni, naponta mindössze 23 centért.

MarkTechPost
AI-jal gyorsítják a 5G hálózatokat, nincs szükség CSI-re
KutatásAI

AI-jal gyorsítják a 5G hálózatokat, nincs szükség CSI-re

A kutatók a hagyományos pilot-alapú csatornabecslést felhasználói lokalizációs adatokkal váltották ki, jelentősen csökkentve a számítási terhelést.

ArXiv AI
Az AI elengedheti a rádiós hálózatok legnagyobb terhét az ArXiv szerint
KutatásAI

Az AI elengedheti a rádiós hálózatok legnagyobb terhét az ArXiv szerint

A kutatók mechanikusan állítható fém reflektortömbökkel kísérleteztek, melyekkel a jövő okos rádiókörnyezeteit forradalmasíthatják.

ArXiv AI
Az amerikai hadsereg saját chatbotot fejleszt a harctéri feladatokhoz
KutatásAI

Az amerikai hadsereg saját chatbotot fejleszt a harctéri feladatokhoz

Létezik már a Victor névre keresztelt prototípus, amelybe több mint 500 adatrepozitóriumot tápláltak be. A rendszer célja, hogy a katonák hasznos információkhoz jussanak.

Wired
Az AI fejleszti az AI-t: új módszert talált a bizonytalanság mérésére
KutatásAI

Az AI fejleszti az AI-t: új módszert talált a bizonytalanság mérésére

A mesterséges intelligencia által generált új UQ-módszerek akár 6,7%-os javulást hoztak a ROC-AUC mutatóban kilenc adathalmazon, felülmúlva a manuálisan tervezett alapmodelleket.

ArXiv NLP
A TABQAWORLD a vizuális és szöveges adatokkal javítja a táblázatkezelést
KutatásAI

A TABQAWORLD a vizuális és szöveges adatokkal javítja a táblázatkezelést

A TABQAWORLD nevű új keretrendszer dinamikusan vált a vizuális és szöveges adatok között, ezzel optimalizálva a többlépcsős táblázatkezelési feladatokat.

ArXiv AI
Megtanulja a mesterséges intelligencia, hol melegszik a sütő: 14%-kal javult az IBM modellje
KutatásAI

Megtanulja a mesterséges intelligencia, hol melegszik a sütő: 14%-kal javult az IBM modellje

Az ALTK-Evolve nevű, hosszú távú memóriarendszerrel felvértezett AI-ügynökök nem pusztán feljegyzéseket olvasnak újra, hanem az elveket sajátítják el a tapasztalatokból.

Hugging Face
Új módszerrel becsülnék meg a LLM-ek hibaszázalékát
KutatásAI

Új módszerrel becsülnék meg a LLM-ek hibaszázalékát

A módszer három különböző adatforrást kombinál, többek között emberi címkézésű kalibrációs adatkészleteket és LLM-alapú értékeléseket.

ArXiv NLP
Hatmadár-elmélet: az AI-ügynökök nem önálló entitások
KutatásAI

Hatmadár-elmélet: az AI-ügynökök nem önálló entitások

Az ArXiv AI-n közzétett tanulmány szerint az úgynevezett Six Birds Theory az AI-ügynököket makroszkopikus objektumként kezeli. A kutatók ezzel új szemléletet kínálnak az AI-ügynökök működésére.

ArXiv AI
Az AI-ügynökök eszköztudása illúzió lehet egy új tanulmány szerint
KutatásAI

Az AI-ügynökök eszköztudása illúzió lehet egy új tanulmány szerint

Korlátozott kísérletek félrevezető következtetésekhez vezethettek az AI-ügynökök eszköztudásával kapcsolatban. Az AI-ügynökök eszköztudása illúzió lehet.

ArXiv NLP
A VIGIL valós időben vadássza le a kognitív torzításokat az AI-szövegekben
KutatásAI

A VIGIL valós időben vadássza le a kognitív torzításokat az AI-szövegekben

A mesterséges intelligencia által generált tartalmak egyre nagyobb veszélyt jelentenek az online információk megbízhatóságára és a társadalmi diskurzusra, ezért fejlesztették ki a VIGIL-t, egy

ArXiv NLP
Tíz alacsony erőforrású nyelven is hatékonyabb a sok példás ICL
KutatásAI

Tíz alacsony erőforrású nyelven is hatékonyabb a sok példás ICL

A kutatók húsz, korábban kevésbé támogatott nyelven tesztelték a módszert, amely a nyelvi modellek fordítási képességét javítja.

ArXiv NLP
Játékkal edzenéd magad LLM ellen? A szerepjáték növeli az AI-ellenállást
KutatásAI

Játékkal edzenéd magad LLM ellen? A szerepjáték növeli az AI-ellenállást

A LLMimic nevű interaktív oktatóanyagban a felhasználók egy LLM szerepébe bújva sajátíthatják el a betanítási folyamat főbb lépéseit.

ArXiv NLP
Az új neuro-szimbolikus architektúra 24%-kal javítja a LLM-ek pontosságát ARC-feladatokban
KutatásAI

Az új neuro-szimbolikus architektúra 24%-kal javítja a LLM-ek pontosságát ARC-feladatokban

A rendszer a hagyományos, tisztán neurális hálózatok és a szigorúan szimbolikus rendszerek hiányosságait küszöböli ki, miközben a LLM-eket objektumreprezentációkkal egészíti ki.

ArXiv AI
11 cikk
A LLM mint bíró tanít be kisebb modelleket, címke nélkül
KutatásAI

A LLM mint bíró tanít be kisebb modelleket, címke nélkül

Az új RL-keretrendszerrel a kisebb nyelvi modellek képesek felülmúlni a hagyományos, címkézett adatokkal történő betanítást, különösen matematikai feladatoknál.

ArXiv NLP
A XpertBench felrázza a LLM-tesztelést, 1346 feladattal méri a szakértelmet
KutatásAI

A XpertBench felrázza a LLM-tesztelést, 1346 feladattal méri a szakértelmet

A 80 kategóriát átfogó adatbázist több mint ezer iparági és kutatói szakértő állította össze, ezzel garantálva a feladatok valósághűségét és relevanciáját.

ArXiv AI
Kizárná a valótlan sztorikat az új RAG-rendszer a kulturális örökség digitalizálásánál
KutatásAI

Kizárná a valótlan sztorikat az új RAG-rendszer a kulturális örökség digitalizálásánál

Az új RAG-architektúra a Live Aid koncertről szóló tudásgráfot használta fel a tesztelés során.

ArXiv AI
Felmérés: az amerikaiak 51 százaléka AI-eszközt használ, de a bizalom stagnál
KutatásAI

Felmérés: az amerikaiak 51 százaléka AI-eszközt használ, de a bizalom stagnál

1397 amerikai felnőtt megkérdezésével készült felmérés szerint 51 százaléka használ AI-eszközöket, ami 37 százalékos növekedés az egy évvel ezelőtti adatokhoz képest.

The Decoder
Új hálózati modell mérné a szövegek koherenciáját
KutatásAI

Új hálózati modell mérné a szövegek koherenciáját

A kutatók egy új, SSN (Sentence/Skeleton Similarity Network) nevű hálózatot javasoltak, amely a szövegkohéziót két mondat közötti konzisztenciával méri.

ArXiv NLP
A PolyJarvis már mondatokból jósol polimer tulajdonságokat
KutatásAI

A PolyJarvis már mondatokból jósol polimer tulajdonságokat

A PolyJarvis egy LLM-et és a RadonPy szimulációs platformot kapcsolja össze MCP szervereken keresztül, így automatizálja a teljes előrejelzési folyamatot.

ArXiv NLP
Új módszer felezi a LLM-ek méretét, betanítás nélkül
KutatásAI

Új módszer felezi a LLM-ek méretét, betanítás nélkül

A SoLA nevű eljárás a transzformer architektúrájú modellek feed-forward hálózatában (FFN) azonosítja a kulcsfontosságú komponenseket.

ArXiv NLP
57 token előrejelzési ablak mutatja meg a Phi-3-mini viselkedését
KutatásAI

57 token előrejelzési ablak mutatja meg a Phi-3-mini viselkedését

A kutatók az új energiaalapú keretrendszerrel a transzformer inferencia dinamikáját vizsgálták, összekötve azt a neurális számítási modellekkel.

ArXiv AI
A TRACE-KG a komplex dokumentumokból is koherens tudásgráfot épít
KutatásAI

A TRACE-KG a komplex dokumentumokból is koherens tudásgráfot épít

Az új, multimodális keretrendszer kiküszöböli a fix ontológiák szükségességét, ehelyett adatokból generál sémát a gazdagabb kontextus érdekében.

ArXiv AI
Nagy nyelvi modellek formálják az emberi erkölcsi és spirituális döntéseket
KutatásAI

Nagy nyelvi modellek formálják az emberi erkölcsi és spirituális döntéseket

Nagy nyelvi modellek aktívan alakítják az emberi megértést és döntéshozatalt, közvetítenek erkölcsi és spirituális kérdéseket.

ArXiv AI
Holos: A webméretű AI-ügynökrendszerrel lépne szintet az AGI
KutatásAI

Holos: A webméretű AI-ügynökrendszerrel lépne szintet az AGI

A rendszer egy ötrétegű architektúrával működik, amelyben a Nuwa motor felel az ügynökök hatékony generálásáért és futtatásáért.

ArXiv AI

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom