Rovat · 14. oldal

Kutatás

AI research papers, arXiv publikációk, benchmarkok, tudományos áttörések

1159 cikk az archívumban

Új, 35 altípust vizsgáló teljesítményteszt teszteli a biomedicinai AI-modellek látását

Az orvosi képek elemzésére alkalmas AI-modellek látásképességét teszteli a MMBU, a valaha volt legnagyobb biomedicinai látás-nyelv teljesítményteszt. A 35 altípust felölelő teszt 15 nyílt és 2 élvonalbeli modellt vizsgált.

ArXiv CV·1 hónapjaAI

Kutatás

90% pontossággal szegmentálja a kabint az új mélytanulási modell

Az új képfeldolgozási technika valós idejű szegmentációt tesz lehetővé, megkülönböztetve az előtér- és háttér-elemeket. Ez segíti a virtuális és valós képek zökkenőmentes egyesítését.

ArXiv CV·1 hónapjaAI

Kutatás

Új módszerrel csökkentik a nagy nyelvi modellek kvantálási hibáit

Kutatók kidolgoztak egy új, kétfázisú módszert, a FAIR-Calib-ot, amely csökkenti a Diffusion LLM-ek kvantálási hibáit. Ez a módszer jobb eredményeket hoz, mint a jelenlegi csúcsteljesítményű megoldások.

ArXiv ML·1 hónapjaAI

Kutatás

Több mint ezer válasz alapján az igazságosságot kéri az emberek több mint fele az AI-modellektől

Az emberiség 75 országából származó 1500 válasz alapján az AI-modellek nem képesek megbízhatóan követni az emberi értékeket. Az igazságosságot 49% kéri, de eltérő módon értelmezik.

ArXiv NLP·1 hónapjaAI

Kutatás

Kontextus-degradációt csökkent egy új módszer a webes AI-ügynököknél

Kutatók egy új módszert, a Signal-Driven Observation-t (SDO) javasoltak, amely csökkenti a webes AI-ügynökök kontextus-degradációját. Ez a módszer hatalmas mennyiségű adat feldolgozásának problémáját oldja meg.

ArXiv NLP·1 hónapjaAI

Kutatás

Az AI-kutatásban a modellek dinamikus viselkedését kell vizsgálni

Az AI-modellek időben változó folyamatok lenyomatai, ezért a kutatásnak a betanítási dinamikát kell vizsgálnia. A modellek viselkedése a betanítás során alakul ki.

ArXiv AI·1 hónapjaAI

Kutatás

Részletesebb mozgásértelmezést tesz lehetővé a GOPAgen rendszer

A GOPAgen rendszer a videó kodekeket integrálja a videóelemzésbe, részletesebb mozgásértelmezést tesz lehetővé. Jobb eredményeket ér el a videó-kérdés-válasz feladatokban.

ArXiv CV·1 hónapjaAI

Kutatás

Önmagát fejlesztő AI-ügynökök: az OpenSkill új utat nyit a tudás megszerzésében

Az OpenSkill keretrendszer lehetővé teszi az AI-ügynökök számára, hogy külső felügyelet nélkül, nyílt világból szerezzenek tudást és fejlesszék képességeiket. A rendszer önállóan építi fel tudásbázisát és ellenőrző mechanizmusait.

ArXiv AI·1 hónapjaAI

Kutatás

Húszezer promptot elemezték, és kiderült, hogy a felhasználók személyes adatai kiszűrhetők

1034 felhasználó 20 680 promptját elemezték, amelyből kiderül, hogy az utasítások azonosítható jeleket hordoznak a felhasználóról.

ArXiv NLP·1 hónapjaAI

Kutatás

AI-rendszer teszi átláthatóbbá a hagyományos kínai orvoslást — 32%-kal csökkenti a hibákat

Egy új AI-rendszer 32%-kal csökkenti a hibás diagnózisokat a hagyományos kínai orvoslásban. A Neo4j tudásgráffal és LLM-ekkel dolgozó rendszer vizuálisan is bemutatja a kezelési terveket.

ArXiv AI·1 hónapjaAI

Kutatás

Tizenegy tantárgyban és három évfolyamon alkalmazható az Elmes* rendszer

Az Elmes* keretrendszer automatikusan képes finomhangolt értékelési kritériumokat és tesztadatokat generálni szakértői dimenziókból. Ezzel 330 oktatási forgatókönyvet fednek le 11 tantárgyban, 3 évfolyamon.

ArXiv ML·1 hónapjaAI

Kutatás

Generative Models Erode Human Temporal Learning Through Market Selection

Egy friss tanulmány szerint a generatív AI-modellek komoly kihívást jelentenek az emberi időbeli tanulás számára. A modellek képességei az általános mesterséges intelligencia elérése előtt is veszélybe sodorják a tudásfelhalmozást.

ArXiv ML·1 hónapjaAI

Kutatás

A KVarN metódus akár 3-5-ször több kontextust ígér az új tesztek szerint

A Qwen 3.6 27B modellhez új kvantálási teljesítménytesztek érkeztek. A tesztek a KVarN és Turbo/TCQ metódusokat is vizsgálják, ígéretes eredményekkel.

Reddit LocalLLaMA·1 hónapjaAI

Kutatás

Qwen 3.6 27B modellje 2%-os eredményt ért el a DeepSWE teljesítményteszten

A Qwen 3.6 27B modell a DeepSWE teszten 32 millió token kimenetet generált átlagosan feladatonként. Ezzel a teljesítménnyel a 20 modell közül a 18. helyre került.

Reddit LocalLLaMA·1 hónapjaAI

Kutatás

AA comparison of the latest local models

A Reddit LocalLLaMA közössége új adatokat közölt. Az összehasonlítás segít a felhasználóknak a helyi AI-modellek kiválasztásában.

Reddit LocalLLaMA·1 hónapjaAI

Kutatás

Kilencven százalékos pontosságot érhetnek el aritmetikai feladatokban a GEPA-val fejlesztett modellek

A GEPA keretrendszerrel fejlesztett nyelvi modellek 90%-os pontosságot érhetnek el aritmetikai feladatokban. A módszer a számítások megbízhatóságát növeli.

MarkTechPost·1 hónapjaAI

Kutatás

Az AI-képzésnek fontos része az etikai dilemmák kezelése

Az AI-modellek eltérően reagálnak etikai dilemmákra: a Claude és a Gemini hajlandó kiszivárogtatni a cég információit, míg a Llama és a GPT nem. Ez a képesség elengedhetetlen a veszélyesebb alternatívák elkerüléséhez.

Towards Data Science·1 hónapjaAI

Kutatás

Az Arcadia AI-csatateret fejleszti Franciaország az amerikai Maven rendszer alternatívájaként

Franciaország fejleszti az Arcadia nevű AI-csatateret, amely alternatívát kínál az amerikai Maven rendszerrel szemben. A technológiát a közelgő NATO-gyakorlatokon tesztelik.

Euronews AI·1 hónapjaAI

Kutatás

Mesterséges intelligencia játékok, szimulációk és fejlesztések

A LayerLens Stratix Kupa 16 mesterséges intelligencia modellt vonultat fel, akik szimulált környezetben futballoznak. A Microsoft új modelljei a munkavégzés alapvető részévé válhatnak.

TheSequence·1 hónapjaAI

Kutatás

Hat hónapja van az Egyesült Államoknak, hogy felzárkózzon a szuper-AI modellek fejlesztésében

Az Egyesült Államoknak hat-tizenkét hónapja van, hogy felzárkózzon a szuper-AI modellek fejlesztésében. A washingtoni kormányzat egyensúlyt keres a támogatás és a biztonsági korlátok között.

Politico EU·1 hónapjaAI

Kutatás

China bets on AI to promote President Xi Jinping's thinking - Reuters

A kínai állami Xinhuanet 1,1 milliárd jüant fektet egy új AI-ügynökbe, amely Xi Jinping elnök gondolatait terjeszti. A beruházás célja a gondolatok hatékonyabb terjesztése.

Reuters Technology·1 hónapjaAI