Rovat · 9. oldal

Kutatás

AI research papers, arXiv publikációk, benchmarkok, tudományos áttörések

1159 cikk az archívumban

Új teljesítménytesztet mutattak be az AI-ügynökök biztonságának értékelésére

Az OSGuard teljesítményteszt a számítógépes feladatokat végző AI-ügynökök biztonságát értékeli, feltárva a helyi és végpontok közötti biztonsági réseket.

ArXiv AI·1 hónapjaAI

Kutatás

Memóriatakarékosabbá válik a nagy nyelvi modellek finomhangolása az AdaNAGED technika segítségével

Az AdaNAGED nevű új technika memóriatakarékosabbá teszi a nagy nyelvi modellek (LLM) finomhangolását, miközben a hagyományos módszereknél olcsóbb lehet a feladat-specifikus beállítás.

ArXiv ML·1 hónapjaAI

Kutatás

Új módszerrel integrálja a tudást 93,5%-os pontossággal a GRASP

Az új GRASP módszer memóriatakarékosan, 93,5%-os pontossággal integrál tudást több forrásból, szemben az ensemble módszer 71,7%-ával.

ArXiv ML·1 hónapjaAI

Kutatás

Bemutatta a DeLM-et a Stanford, 50%-kal csökkenti az AI-ügynökök költségeit

A Stanford kutatói által kifejlesztett DeLM keretrendszer decentralizált koordinációval 50%-kal csökkenti az AI-ügynökök feladatköltségeit, közölte Yuzhen Mao és Azalia Mirhoseini.

VentureBeat·1 hónapjaAI

Kutatás

Kutatók fejlesztettek egy modult, amely valódi személyiséget ad a mesterséges intelligenciának

Az új PsychAdapter modul képes szimulálni a beszélő személyiségjegyeit, életkorát és mentális állapotát, 87%-os pontossággal a személyiség, 97%-kal a mentális egészség tekintetében.

Hetzner: Stanford HAI·1 hónapjaAI

Kutatás

Új módszer méri a látási-nyelvi modellek bizonytalanságát

Kutatók kidolgoztak egy új keretrendszert, a FUSE-t, amely a látási és nyelvi modellek bizonytalanságát méri. A módszer kombinálja az aleatorikus és episztemikus forrásokat, és megbízhatóan jelzi előre a modell kimenetének helyességét.

ArXiv CV·1 hónapjaAI

Kutatás

Két AI-modell együttműködése javítja a videóérthetőséget — 1,4%-kal pontosabb válaszok

A módszer a nehéz kérdések esetében 1,4%-kal pontosabb eredményeket hoz, és az ImplicitQA teljesítményteszten mutatta be hatékonyságát.

ArXiv CV·1 hónapjaAI

Kutatás

Saját szuperszámítógépeivel 2028-ra fejlett AI-t hozhat Európa

Ez az együttműködés évekkel megelőzheti az új adatközpontok árammal való ellátását, és lehetővé teheti a fejlett AI-modellek korábbi fejlesztését.

Hacker News·1 hónapjaAI

Kutatás

Nyílt teljesítményteszten játszik a Balatroval az AI — a modell maga dönt a lépésekről

Az Evalatro nevű új, nyílt teljesítményteszt lehetővé teszi, hogy a nyelvi modellek önállóan, taktikai segítséget nem kérve játsszanak a népszerű Balatro videójátékkal.

Reddit LocalLLaMA·1 hónapjaAI

Kutatás

Anyagként viselkedő robotkolónia jött létre a Cornell Egyetemen

A Cornell Egyetem kutatói által kifejlesztett Cross-Link Collective nevű rendszer tucatnyi kis robotból áll, amelyek együttesen koordinált mozgást mutatnak, miközben az intelligencia fizikai kölcsönhatásaikban rejlik.

Robohub·1 hónapjaAI

Kutatás

Új platform méri a stratégiai gondolkodást az AI-modellekben — a Claude Opus csak ötödik lett

A Claude Opus mögött végzett modellek között olyanok voltak, mint a PaLM, a LLaMA és a Chinchilla, amelyek jobb stratégiai gondolkodást mutattak a Poker Arena tesztjén. A platform által nyújtott részletes elemzés segíthet az AI-kutatóknak a modellek fejlesztésében.

ArXiv AI·1 hónapjaAI

Kutatás

Nulla hibával tanítják a neurális hálózatokat a MIT kutatói

A MIT kutatói által bemutatott neurális lazító változók nullára csökkentik a neurális hálózatok tanítása során fellépő hibákat, különösen a komplex formai korlátok, mint a monotonitás és konvexitás érvényesítésekor.

ArXiv ML·1 hónapjaAI

Kutatás

Hatékonyabb videógenerálást tesz lehetővé a Temporal Backtracking Search

A Temporal Backtracking Search (TBS) új keresési stratégiával alakítja át a videógenerálást, lehetővé téve a hibás indulások újrakezdését és a számítási kapacitás hatékonyabb elosztását.

ArXiv CV·1 hónapjaAI

Kutatás

63%-ra növeli a találati arányt a TwinBI új rendszere

A TwinBI keretrendszer 43,3%-ról 63,3%-ra növeli a pontos találati arányt a BI-irányítópultokkal végzett elemzések során, miközben a hibás válaszok aránya 40%-ról 10%-ra csökken.

ArXiv AI·1 hónapjaAI

Kutatás

Keresztény öröklési jogi feladatokon tesztelték az AI-modelleket — a Gemini vezet

A nagy nyelvi modellek képességét vizsgálták keresztény jogi öröklési esetek megoldására. A kereskedelmi modellek, különösen a Gemini 2.5 Flash, megbízhatóbban teljesítenek, mint a nyílt forráskódú társaik.

ArXiv NLP·1 hónapjaAI

Kutatás

Személyre szabott AI-modellek pontosságát javítja a FedSPC — új módszerrel dolgoznak a kutatók

A FedSPC nevű, moduláris korrekciós módszerrel a kutatók úgy vélik, javítható a személyre szabott federált tanulás (PFL) pontossága, különösen az adatheterogenitás esetén. A CIFAR-100 és Tiny-ImageNet adathalmazokon végzett kísérletek ezt alátámasztják.

ArXiv ML·1 hónapjaAI

Kutatás

Az AI kulcsfontosságú az akkumulátorfejlesztés felgyorsításában

Az AI képes radikálisan felgyorsítani az akkumulátorfejlesztést, ami a zöld átállás elsődleges feltétele — véli Andreas Hoepner, az EU Fenntartható Finanszírozási Platformának munkatársa.

Financial Times·1 hónapjaAI

Kutatás

Gyorsabb állatfelismerést hoz a Microsoft új, gyengén felügyelt AI-rendszere

A Microsoft új, gyengén felügyelt AI-keretrendszere, az OWL, akár hétszer gyorsabban és háromszor olcsóbban képes állatokat felismerni légi felvételeken, mint a hagyományos módszerek.

ArXiv CV·1 hónapjaAI

Kutatás

AI-ütemező 15%-kal javítja a robotok munkáját

Egy új Transformer-alapú AI-modell 15-30%-kal csökkenti a robotok munkájának ütemezési idejét, miközben nagyméretű, 100x100-as feladatokra is képes általánosítani.

ArXiv AI·1 hónapjaAI

Kutatás

Hyperdimenziós számítással kereshetők strukturált lekérdezések táblázatos adatokban

A hyperdimenziós számítás (HDC) új keretrendszert kínál a táblázatos adatok lekérdezésére, amely interpretálhatóbb eredményeket ad, mint a korábbi módszerek.

ArXiv AI·1 hónapjaAI

Kutatás

Narayanan és Kapoor szerint az AI nem váltja fel a szoftverfejlesztőket

Több mint 160 vállalat adott be WARN-értesítést 2025 márciusa óta, Arvind Narayanan és Sayash Kapoor szerint az AI nem váltja fel a szoftverfejlesztőket, mivel a munka nagy része megbeszélésekben és hibakeresésben zajlik.

Simon Willison·1 hónapjaAI