ÉlőUtoljára: 1 órájaMa: 20

Rovat · 30. oldal

Kutatás

AI research papers, arXiv publikációk, benchmarkok, tudományos áttörések

813 cikk az archívumban

Új AI-módszer rangsorolja a döntési alternatívákat: kardinális és ordinális adatokkal is dolgozik
Kutatás

Új AI-módszer rangsorolja a döntési alternatívákat: kardinális és ordinális adatokkal is dolgozik

A Multi-Criteria Analysis (MCA) módszereket kiegészítő új megközelítés a szubjektív torzításokat és az adatok sokféleségéből adódó pontatlanságokat igyekszik kiküszöbölni.

ArXiv AI·AI
A LLM-eknek hiányzik a lustaság erénye Cantrill szerint: rendszerek nőnek, de nem javulnak
Kutatás

A LLM-eknek hiányzik a lustaság erénye Cantrill szerint: rendszerek nőnek, de nem javulnak

Bryan Cantrill, a technológiai ipar ismert alakja, úgy véli, a LLM-ek nem optimalizálnak a jövőbeli időre, és ez komoly problémákat okozhat a rendszerek tervezésében.

Simon Willison·AI
A mesterséges intelligencia nem tud focira fogadni: még a Grok is csődbe ment
Kutatás

A mesterséges intelligencia nem tud focira fogadni: még a Grok is csődbe ment

A Google, az OpenAI és az Anthropic modelljei is pénzt buktak egy teljes Premier League szezon focifogadásain, ami rávilágít a valós világ elemzésének kihívásaira.

Ars Technica·AI
Új keretrendszerrel születnek arany-standard török oktatóvideó-összefoglalók
Kutatás

Új keretrendszerrel születnek arany-standard török oktatóvideó-összefoglalók

Kutatás keretében fejlesztettek ki egy új módszert, amely automatikusan és reprodukálhatóan hoz létre arany-standard összefoglalókat török oktatóvideókból, több emberi összefoglalás alapján.

ArXiv NLP·AI
Új KA-FCM modellel oldanák meg a komplex dinamikus rendszerek modellezését
Kutatás

Új KA-FCM modellel oldanák meg a komplex dinamikus rendszerek modellezését

A frissen bemutatott megoldás a Fuzzy Kognitív Térképek (FCM) korlátait hivatott feloldani, különösen a nem-monoton ok-okozati összefüggések terén.

ArXiv AI·AI
Feltárja a SenseAI a pénzügyi modellek hibáit, felfedve a „Latent Reasoning Drift” jelenséget
Kutatás

Feltárja a SenseAI a pénzügyi modellek hibáit, felfedve a „Latent Reasoning Drift” jelenséget

A SenseAI adathalmaz a LLM-ek finomhangolását segíti, miközben rendszerszintű hibákat, például a „Latent Reasoning Drift” jelenséget is azonosít a pénzügyi elemzéseikben.

ArXiv NLP·AI
A Reddit szerint az AI rendszerek teljesítménymérése egyre bonyolultabb
Kutatás

A Reddit szerint az AI rendszerek teljesítménymérése egyre bonyolultabb

Egy szakértői csoport szerint az AI modellek teljesítményének értékelése összetett mérnöki feladat, amely a szoftverfejlesztési feladatok komplexitásán alapul. A csoport egy diagramot publikált, amely az AI modelleket hasonlítja össze a feladatok komplexitása alapján.

Reddit ML·AI
Új teljesítményteszt vizsgálja a LLM-ek tudásdriftjét, korlátokat tárt fel
Kutatás

Új teljesítményteszt vizsgálja a LLM-ek tudásdriftjét, korlátokat tárt fel

A nagyméretű nyelvi modellek (LLM) betanításkor rögzített tudása folyamatosan elavul, ami kihívást jelent a valós idejű adaptációban.

ArXiv NLP·AI
Mustafa Suleyman: az AI számítási teljesítménye 1000-szeresére nő 2028 végére
Kutatás

Mustafa Suleyman: az AI számítási teljesítménye 1000-szeresére nő 2028 végére

A chipek hétszeres teljesítménynövekedése, a háromszoros memória-sávszélesség és a GPU-hálózatok együttes hatása hozza a fejlődést — az AI telepítési költségei éves szinten akár 900-szorosára csökkentek.

MIT Technology Review·AI
Algebrai struktúrákkal csökkenti a keresési teret egy új optimalizálási keretrendszer
Kutatás

Algebrai struktúrákkal csökkenti a keresési teret egy új optimalizálási keretrendszer

Kombinatorikus optimalizálási feladatok rejtett algebrai struktúrákat tartalmaznak, amelyek feltárása csökkenti a keresési teret. A módszer segítségével hatékonyabb megoldások érhetők el.

ArXiv AI·AI
A QIMMA kiszűri a hibákat az arab nyelvi LLM-benchmarkingból
Kutatás

A QIMMA kiszűri a hibákat az arab nyelvi LLM-benchmarkingból

Több mint 52 ezer mintát tartalmazó értékelési csomagot hozott létre a QIMMA, ezzel a meglévő arab nyelvi LLM-benchmarkingok hiányosságait orvosolja.

ArXiv NLP·AI
A Memento-Skills maga írja át a saját képességeit, nem kell betanítani
Kutatás

A Memento-Skills maga írja át a saját képességeit, nem kell betanítani

A több egyetem kutatói által fejlesztett Memento-Skills rendszer a GAIA teljesítményteszt során 13,7 százalékponttal javította a teszteredmények pontosságát egy statikus alapmodellhez képest.

VentureBeat·AI
Új AI-módszer javítja a klinikai diagnózist: figyelembe veszi a bizonytalanságot
Kutatás

Új AI-módszer javítja a klinikai diagnózist: figyelembe veszi a bizonytalanságot

A módszer egy tervező és egy diagnosztikai LLM-ügynökön keresztül kezeli a bizonytalanságot, képes a szekvenciális adatgyűjtést modellezni.

ArXiv AI·AI
Új teszt kerüli meg a LLM-ek korlátját a telekommunikációban
Kutatás

Új teszt kerüli meg a LLM-ek korlátját a telekommunikációban

A TelcoAgent-Bench nevű keretrendszer nem csupán a nyelvi megértést méri, hanem a strukturált hibaelhárítási folyamatokkal való összehangolást és a forgatókönyv-változatok stabilitását is értékeli.

ArXiv NLP·AI
Az AI chatbotok homogenizálják gondolkodásunkat, csökkentve a kollektív bölcsességet
Kutatás

Az AI chatbotok homogenizálják gondolkodásunkat, csökkentve a kollektív bölcsességet

Egy USC-tanulmány szerint a chatbotok egységesítik az írás stílusát és az érvelési stratégiákat — a kutatók több valós diverzitást sürgetnek a betanítási adatokban.

Hacker News·AI
Az OSGym 90%-kal olcsóbbá teszi az AI ügynökök képzését
Kutatás

Az OSGym 90%-kal olcsóbbá teszi az AI ügynökök képzését

A MIT, UIUC, CMU és UC Berkeley kutatói által fejlesztett OSGym keretrendszer egyidejűleg több mint ezer virtuális asztalt képes kezelni, naponta mindössze 23 centért.

MarkTechPost·AI
AI-jal gyorsítják a 5G hálózatokat, nincs szükség CSI-re
Kutatás

AI-jal gyorsítják a 5G hálózatokat, nincs szükség CSI-re

A kutatók a hagyományos pilot-alapú csatornabecslést felhasználói lokalizációs adatokkal váltották ki, jelentősen csökkentve a számítási terhelést.

ArXiv AI·AI
Az AI elengedheti a rádiós hálózatok legnagyobb terhét az ArXiv szerint
Kutatás

Az AI elengedheti a rádiós hálózatok legnagyobb terhét az ArXiv szerint

A kutatók mechanikusan állítható fém reflektortömbökkel kísérleteztek, melyekkel a jövő okos rádiókörnyezeteit forradalmasíthatják.

ArXiv AI·AI
Az amerikai hadsereg saját chatbotot fejleszt a harctéri feladatokhoz
Kutatás

Az amerikai hadsereg saját chatbotot fejleszt a harctéri feladatokhoz

Létezik már a Victor névre keresztelt prototípus, amelybe több mint 500 adatrepozitóriumot tápláltak be. A rendszer célja, hogy a katonák hasznos információkhoz jussanak.

Wired·AI
Az AI fejleszti az AI-t: új módszert talált a bizonytalanság mérésére
Kutatás

Az AI fejleszti az AI-t: új módszert talált a bizonytalanság mérésére

A mesterséges intelligencia által generált új UQ-módszerek akár 6,7%-os javulást hoztak a ROC-AUC mutatóban kilenc adathalmazon, felülmúlva a manuálisan tervezett alapmodelleket.

ArXiv NLP·AI
A TABQAWORLD a vizuális és szöveges adatokkal javítja a táblázatkezelést
Kutatás

A TABQAWORLD a vizuális és szöveges adatokkal javítja a táblázatkezelést

A TABQAWORLD nevű új keretrendszer dinamikusan vált a vizuális és szöveges adatok között, ezzel optimalizálva a többlépcsős táblázatkezelési feladatokat.

ArXiv AI·AI

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom