Az Egyesült Államok már nem vezet az AI modell teljesítményben, az adatok alapján Kína egyre inkább felzárkózik. 2026-ban az AI modell teljesítményben tapasztalt fejlődés az USA és Kína közötti szakadékot bezárta.
AI News
214 cikk összesen (szűrt)
Az Egyesült Államok már nem vezet az AI modell teljesítményben, az adatok alapján Kína egyre inkább felzárkózik. 2026-ban az AI modell teljesítményben tapasztalt fejlődés az USA és Kína közötti szakadékot bezárta.
AI News
A mesterséges intelligencia modellek is mutatják az azonosítható áldozat hatását, amely szerint az emberek hajlamosabbak segíteni egy konkrét áldozatot, mint egy statisztikailag jellemzett csoportot. 51 955 API-teszt igazolta ezt a torzítást 16 modellnél.
ArXiv NLP
A kutatók egy LLM‑alapú bírórendszert is bemutattak, amely emberi jelölésekkel ellenőrizve képes automatikusan azonosítani a hibákat.
ArXiv AI
Az AgenticAI-DialogGen rendszer önállóan kinyer tudásgráfokat és felépíti beszélő személyiségeket. A rendszer moduláris ügynökökkel vezérelt.
ArXiv NLP
Ezzel a fejlesztéssel a Databricks lehetővé teszi a felhasználók számára, hogy hatékonyabban kezeljék a strukturált és strukturálatlan adatokat, és jobb eredményeket érjenek el a hibrid lekérdezések során.
VentureBeat
Az AI-modellek már a PhD-szintű tudományos kérdésekben és a versenyképes matematikában is jobban teljesítenek, mint az ember. Ez az előrelépés egy év alatt következett be.
The Decoder
Andrej Karpathy, a neves AI-kutató, egy mindössze 200 soros Python szkripttel tette közzé a microgpt-t, amely egy teljes GPT modell betanítására és következtetésére is képes.
Andrej Karpathy
Egy új AI modell a teljes test mozgását figyelembe vevő, részletes akcióreprezentációt használ, ami jelentős lépést jelent a komplex valós környezetek és az emberi viselkedés modellezésében. A modell a múltbeli képkockák és a kívánt 3D pózváltozások alapján jósolja meg a következő videóképet.
BAIR Blog
A keretrendszerrel a változó hosszúságú hang- vagy szöveges adatok fonetikai tartalmát rögzített dimenziós beágyazási térbe lehet leképezni.
Apple ML
A Berkeley Egyetem kutatói 100 önvezető autót használtak csúcsforgalomban a torlódások csökkentésére. A kísérletben mesterséges intelligenciával vezérelt autók vettek részt, amelyek a 'stop-and-go' hullámokat célozták.
BAIR Blog
A Multi-Criteria Analysis (MCA) módszereket kiegészítő új megközelítés a szubjektív torzításokat és az adatok sokféleségéből adódó pontatlanságokat igyekszik kiküszöbölni.
ArXiv AI
Bryan Cantrill, a technológiai ipar ismert alakja, úgy véli, a LLM-ek nem optimalizálnak a jövőbeli időre, és ez komoly problémákat okozhat a rendszerek tervezésében.
Simon Willison
A Google, az OpenAI és az Anthropic modelljei is pénzt buktak egy teljes Premier League szezon focifogadásain, ami rávilágít a valós világ elemzésének kihívásaira.
Ars Technica
Kutatás keretében fejlesztettek ki egy új módszert, amely automatikusan és reprodukálhatóan hoz létre arany-standard összefoglalókat török oktatóvideókból, több emberi összefoglalás alapján.
ArXiv NLP
A frissen bemutatott megoldás a Fuzzy Kognitív Térképek (FCM) korlátait hivatott feloldani, különösen a nem-monoton ok-okozati összefüggések terén.
ArXiv AI
A SenseAI adathalmaz a LLM-ek finomhangolását segíti, miközben rendszerszintű hibákat, például a „Latent Reasoning Drift” jelenséget is azonosít a pénzügyi elemzéseikben.
ArXiv NLP
Egy szakértői csoport szerint az AI modellek teljesítményének értékelése összetett mérnöki feladat, amely a szoftverfejlesztési feladatok komplexitásán alapul. A csoport egy diagramot publikált, amely az AI modelleket hasonlítja össze a feladatok komplexitása alapján.
Reddit ML
A nagyméretű nyelvi modellek (LLM) betanításkor rögzített tudása folyamatosan elavul, ami kihívást jelent a valós idejű adaptációban.
ArXiv NLP
A chipek hétszeres teljesítménynövekedése, a háromszoros memória-sávszélesség és a GPU-hálózatok együttes hatása hozza a fejlődést — az AI telepítési költségei éves szinten akár 900-szorosára csökkentek.
MIT Technology Review
Kombinatorikus optimalizálási feladatok rejtett algebrai struktúrákat tartalmaznak, amelyek feltárása csökkenti a keresési teret. A módszer segítségével hatékonyabb megoldások érhetők el.
ArXiv AI
Több mint 52 ezer mintát tartalmazó értékelési csomagot hozott létre a QIMMA, ezzel a meglévő arab nyelvi LLM-benchmarkingok hiányosságait orvosolja.
ArXiv NLP
A több egyetem kutatói által fejlesztett Memento-Skills rendszer a GAIA teljesítményteszt során 13,7 százalékponttal javította a teszteredmények pontosságát egy statikus alapmodellhez képest.
VentureBeat
A módszer egy tervező és egy diagnosztikai LLM-ügynökön keresztül kezeli a bizonytalanságot, képes a szekvenciális adatgyűjtést modellezni.
ArXiv AI
A TelcoAgent-Bench nevű keretrendszer nem csupán a nyelvi megértést méri, hanem a strukturált hibaelhárítási folyamatokkal való összehangolást és a forgatókönyv-változatok stabilitását is értékeli.
ArXiv NLP
Egy USC-tanulmány szerint a chatbotok egységesítik az írás stílusát és az érvelési stratégiákat — a kutatók több valós diverzitást sürgetnek a betanítási adatokban.
Hacker News
A MIT, UIUC, CMU és UC Berkeley kutatói által fejlesztett OSGym keretrendszer egyidejűleg több mint ezer virtuális asztalt képes kezelni, naponta mindössze 23 centért.
MarkTechPost
A kutatók a hagyományos pilot-alapú csatornabecslést felhasználói lokalizációs adatokkal váltották ki, jelentősen csökkentve a számítási terhelést.
ArXiv AI
A kutatók mechanikusan állítható fém reflektortömbökkel kísérleteztek, melyekkel a jövő okos rádiókörnyezeteit forradalmasíthatják.
ArXiv AI
Létezik már a Victor névre keresztelt prototípus, amelybe több mint 500 adatrepozitóriumot tápláltak be. A rendszer célja, hogy a katonák hasznos információkhoz jussanak.
Wired
A mesterséges intelligencia által generált új UQ-módszerek akár 6,7%-os javulást hoztak a ROC-AUC mutatóban kilenc adathalmazon, felülmúlva a manuálisan tervezett alapmodelleket.
ArXiv NLP
A TABQAWORLD nevű új keretrendszer dinamikusan vált a vizuális és szöveges adatok között, ezzel optimalizálva a többlépcsős táblázatkezelési feladatokat.
ArXiv AI
Az ALTK-Evolve nevű, hosszú távú memóriarendszerrel felvértezett AI-ügynökök nem pusztán feljegyzéseket olvasnak újra, hanem az elveket sajátítják el a tapasztalatokból.
Hugging Face
A módszer három különböző adatforrást kombinál, többek között emberi címkézésű kalibrációs adatkészleteket és LLM-alapú értékeléseket.
ArXiv NLP
Az ArXiv AI-n közzétett tanulmány szerint az úgynevezett Six Birds Theory az AI-ügynököket makroszkopikus objektumként kezeli. A kutatók ezzel új szemléletet kínálnak az AI-ügynökök működésére.
ArXiv AI
Korlátozott kísérletek félrevezető következtetésekhez vezethettek az AI-ügynökök eszköztudásával kapcsolatban. Az AI-ügynökök eszköztudása illúzió lehet.
ArXiv NLP
A mesterséges intelligencia által generált tartalmak egyre nagyobb veszélyt jelentenek az online információk megbízhatóságára és a társadalmi diskurzusra, ezért fejlesztették ki a VIGIL-t, egy
ArXiv NLP
A kutatók húsz, korábban kevésbé támogatott nyelven tesztelték a módszert, amely a nyelvi modellek fordítási képességét javítja.
ArXiv NLP
A LLMimic nevű interaktív oktatóanyagban a felhasználók egy LLM szerepébe bújva sajátíthatják el a betanítási folyamat főbb lépéseit.
ArXiv NLP
A rendszer a hagyományos, tisztán neurális hálózatok és a szigorúan szimbolikus rendszerek hiányosságait küszöböli ki, miközben a LLM-eket objektumreprezentációkkal egészíti ki.
ArXiv AI
Az új RL-keretrendszerrel a kisebb nyelvi modellek képesek felülmúlni a hagyományos, címkézett adatokkal történő betanítást, különösen matematikai feladatoknál.
ArXiv NLP
A 80 kategóriát átfogó adatbázist több mint ezer iparági és kutatói szakértő állította össze, ezzel garantálva a feladatok valósághűségét és relevanciáját.
ArXiv AI
Az új RAG-architektúra a Live Aid koncertről szóló tudásgráfot használta fel a tesztelés során.
ArXiv AI
1397 amerikai felnőtt megkérdezésével készült felmérés szerint 51 százaléka használ AI-eszközöket, ami 37 százalékos növekedés az egy évvel ezelőtti adatokhoz képest.
The Decoder
A kutatók egy új, SSN (Sentence/Skeleton Similarity Network) nevű hálózatot javasoltak, amely a szövegkohéziót két mondat közötti konzisztenciával méri.
ArXiv NLP
A PolyJarvis egy LLM-et és a RadonPy szimulációs platformot kapcsolja össze MCP szervereken keresztül, így automatizálja a teljes előrejelzési folyamatot.
ArXiv NLP
A SoLA nevű eljárás a transzformer architektúrájú modellek feed-forward hálózatában (FFN) azonosítja a kulcsfontosságú komponenseket.
ArXiv NLP
A kutatók az új energiaalapú keretrendszerrel a transzformer inferencia dinamikáját vizsgálták, összekötve azt a neurális számítási modellekkel.
ArXiv AI
Az új, multimodális keretrendszer kiküszöböli a fix ontológiák szükségességét, ehelyett adatokból generál sémát a gazdagabb kontextus érdekében.
ArXiv AI
Nagy nyelvi modellek aktívan alakítják az emberi megértést és döntéshozatalt, közvetítenek erkölcsi és spirituális kérdéseket.
ArXiv AI
A rendszer egy ötrétegű architektúrával működik, amelyben a Nuwa motor felel az ügynökök hatékony generálásáért és futtatásáért.
ArXiv AI
Tetszik az oldal? Támogasd a fejlesztést
Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.