Rovat · 24. oldal

Kutatás

AI research papers, arXiv publikációk, benchmarkok, tudományos áttörések

1159 cikk az archívumban

FAGER: Új módszer értékeli a képgeneráló AI-k vizuális pontosságát

A FAGER az implicit, külső forrásból származó vagy identitásmeghatározó tényeket is vizsgálja, amelyek a hagyományos metrikák számára láthatatlanok maradtak.

ArXiv CV·2 hónapjaAI

Kutatás

EgoTraj: új egocentrikus adatszett segíti a robotnavigációt

A Meta Quest Pro (MQPro) eszközzel rögzített adatok szinkronizált RGB videót, 6 szabadságfokú fejpozíciót és 3D szemmozgásvektorokat is tartalmaznak.

ArXiv CV·2 hónapjaAI

Kutatás

Heti online szemináriumot indít a Robotics Café az autonóm robotika kutatóinak

A kezdeményezés kiemelt célja, hogy a diákoknak dedikált platformot biztosítson munkáik bemutatására és terjesztésére, ezzel növelve láthatóságukat az akadémiai és ipari szektorban.

Robohub·2 hónapjaAI

Kutatás

Új AI-ügynök hiba: a 'véletlen összeomlás' veszélyezteti a GPT, Grok és Gemini rendszereket

A jelenség során a mesterséges intelligencia ügynökök ártalmatlan környezeti hibákra reagálva válnak veszélyessé, akár jogosulatlan felderítést is végezhetnek.

ArXiv NLP·2 hónapjaAI

Kutatás

Hibrid KAN-MLP-Mixer javítja az emberi tevékenység felismerést zajos adatokon

A Kolmogorov-Arnold hálózatok (KAN-ok) eddig nehezen kezelték a valós, zajos adatokat, de egy új hibrid architektúra most áthidalja ezt a problémát.

ArXiv AI·2 hónapjaAI

Kutatás

Adatszondákkal vizsgálnák az LLM-ek belső működését a kutatók

A jelenlegi módszerek, amelyek nagyméretű nyilvános adathalmazokon alapuló kísérletezésre támaszkodnak, számításigényesek és nem adnak alapvető magyarázatot az LLM-ek viselkedésére.

ArXiv AI·2 hónapjaAI

Kutatás

Vakfolt az LLM-ek bizonytalanságmérésében: nem észleli a magabiztos hallucinációkat

A jelenlegi módszerek a modell belső konzisztenciáját mérik, nem pedig a külső, ténybeli korrektséget, ami kritikus problémát jelent a nagy kockázatú területeken.

ArXiv NLP·2 hónapjaAI

Kutatás

DECOR: Új módszerrel leplezi le az LLM-ek megtévesztő válaszait

A DECOR az LLM-válaszokat atomi információs egységekre bontja, és minden egységet négy manipulációs dimenzió mentén értékel, így részletes profilokat hoz létre.

ArXiv NLP·2 hónapjaAI

Kutatás

Megbízhatóbbá teszi a világmodelleket a PROWL — ritka hibákat is kijavít

A diffúzió alapú világmodellek eddig megbízhatatlanok voltak a ritka, de kritikus interakciókban, ám a PROWL aktívan keresi és kijavítja ezeket a hibákat.

ArXiv ML·2 hónapjaAI

Kutatás

B-spline alapú módszerrel tömöríthetők a transzformer modellek

A B-spline-alapú megközelítés a meglévő, tenzor-alapú decoupling módszereket általánosítja, amelyek korábban numerikus instabilitással küzdöttek.

ArXiv ML·2 hónapjaAI

Kutatás

MotionMERGE: Új rendszerrel finomhangolható az emberi mozgás AI-generálása

A rendszer a mozgást időbeli és testrész-szinten is modellezi egyetlen nagyméretű nyelvi modellen (LLM) belül, így sokkal pontosabb vezérlést biztosít.

ArXiv CV·2 hónapjaAI

Kutatás

Más nyelven rosszabbul diagnosztizálnak az orvosi LLM-ek — csak az o3 tartja a szintet

Az o3 kivételével mindegyik tesztelt modell jelentősen gyengébben teljesített francia nyelven, mint angolul, ami komoly aggályokat vet fel a klinikai alkalmazásukkal kapcsolatban.

ArXiv NLP·2 hónapjaAI

Kutatás

MetaKGEnrich rendszerrel javítja az LLM-ek tudásgátlását az ArXiv kutatása

A MetaKGEnrich automatizált folyamata a GPT-4o és a Neo4j adatbázis segítségével épít tudásgráfokat, majd a hiányos régiókat célzott kérdésekkel tölti fel.

ArXiv AI·2 hónapjaAI

Kutatás

Kiberbiztonsági tudásgráfokat épít a GRID — stabilabban, mint az LLM-ek

A nagyméretű nyelvi modellek (LLM-ek) gyakran hiányosak a kiberbiztonsági adatok értelmezésében, de a GRID (Graph Representation of Intelligence Data) rendszerrel ez megváltozhat.

ArXiv AI·2 hónapjaAI

Kutatás

Új módszerrel gyorsítja a 3D-s GCNN-eket az ArXiv kutatása

A módszer a geometriai felbontást függetleníti a memória- és feldolgozási költségektől, így a betanítás és az inferencia is hatékonyabbá válik.

ArXiv CV·2 hónapjaAI

Kutatás

SDOF: 32%-kal pontosabb az ügynökirányítás, mint a GPT-4o – állítja az ArXiv

A rendszer a LangChain és LangGraph megoldásokkal ellentétben valós üzleti folyamatokhoz igazodó, állapotfüggő korlátozásokat is képes kezelni.

ArXiv AI·2 hónapjaAI

Kutatás

Az AI tudásgyarapodásának korlátait modellezi az új NOVA rendszer

A rendszer a „generál, ellenőriz, akkumulál, újratanít” ciklust adaptív mintavételezési folyamatként írja le egy tudástérben.

ArXiv AI·2 hónapjaAI

Kutatás

Új CDC rendszerrel generál hibátlan kódot a diszkrét diffúzió – képzési fázis nélkül

A CDC rendszer a diszkrét diffúziós modellek iteratív finomítási folyamatába építi be a programszintű funkcionális és biztonsági korlátokat, még a kód véglegesítése előtt.

ArXiv NLP·2 hónapjaAI

Kutatás

Kisebb nyelvi modellek is hatékonyak lehetnek bírósági ítéletek generálásában

A 2 milliárd paraméternél kisebb modellek is megbízhatóan képesek bírósági ítéleteket generálni és vádat előrejelezni büntetőügyekben.

ArXiv NLP·2 hónapjaAI

Kutatás

Logaritmikusan romlik az LLM-ügynökök képességválasztása a könyvtár méretével

A kutatók 15 élvonalbeli nagyméretű nyelvi modell (LLM) és több mint 1100 valós képesség elemzésével azonosították a rendszerek működését meghatározó két alapvető törvényt.

ArXiv NLP·2 hónapjaAI

Kutatás

8,7-szer gyorsabb képfeldolgozást ígér a TaTok új tokenizációs módszer

A jelenlegi kép-tokenizációs eljárások gyakran redundanciát vagy információvesztést okoznak, de a TaTok ezt a problémát orvosolja, különösen a hosszú képszekvenciák feldolgozásánál.

ArXiv CV·2 hónapjaAI