ÉlőUtoljára: 12 perceMa: 21

Rovat · 31. oldal

Kutatás

AI research papers, arXiv publikációk, benchmarkok, tudományos áttörések

813 cikk az archívumban

Megtanulja a mesterséges intelligencia, hol melegszik a sütő: 14%-kal javult az IBM modellje
Kutatás

Megtanulja a mesterséges intelligencia, hol melegszik a sütő: 14%-kal javult az IBM modellje

Az ALTK-Evolve nevű, hosszú távú memóriarendszerrel felvértezett AI-ügynökök nem pusztán feljegyzéseket olvasnak újra, hanem az elveket sajátítják el a tapasztalatokból.

Hugging Face·AI
Új módszerrel becsülnék meg a LLM-ek hibaszázalékát
Kutatás

Új módszerrel becsülnék meg a LLM-ek hibaszázalékát

A módszer három különböző adatforrást kombinál, többek között emberi címkézésű kalibrációs adatkészleteket és LLM-alapú értékeléseket.

ArXiv NLP·AI
Hatmadár-elmélet: az AI-ügynökök nem önálló entitások
Kutatás

Hatmadár-elmélet: az AI-ügynökök nem önálló entitások

Az ArXiv AI-n közzétett tanulmány szerint az úgynevezett Six Birds Theory az AI-ügynököket makroszkopikus objektumként kezeli. A kutatók ezzel új szemléletet kínálnak az AI-ügynökök működésére.

ArXiv AI·AI
Az AI-ügynökök eszköztudása illúzió lehet egy új tanulmány szerint
Kutatás

Az AI-ügynökök eszköztudása illúzió lehet egy új tanulmány szerint

Korlátozott kísérletek félrevezető következtetésekhez vezethettek az AI-ügynökök eszköztudásával kapcsolatban. Az AI-ügynökök eszköztudása illúzió lehet.

ArXiv NLP·AI
A VIGIL valós időben vadássza le a kognitív torzításokat az AI-szövegekben
Kutatás

A VIGIL valós időben vadássza le a kognitív torzításokat az AI-szövegekben

A mesterséges intelligencia által generált tartalmak egyre nagyobb veszélyt jelentenek az online információk megbízhatóságára és a társadalmi diskurzusra, ezért fejlesztették ki a VIGIL-t, egy

ArXiv NLP·AI
Tíz alacsony erőforrású nyelven is hatékonyabb a sok példás ICL
Kutatás

Tíz alacsony erőforrású nyelven is hatékonyabb a sok példás ICL

A kutatók húsz, korábban kevésbé támogatott nyelven tesztelték a módszert, amely a nyelvi modellek fordítási képességét javítja.

ArXiv NLP·AI
Játékkal edzenéd magad LLM ellen? A szerepjáték növeli az AI-ellenállást
Kutatás

Játékkal edzenéd magad LLM ellen? A szerepjáték növeli az AI-ellenállást

A LLMimic nevű interaktív oktatóanyagban a felhasználók egy LLM szerepébe bújva sajátíthatják el a betanítási folyamat főbb lépéseit.

ArXiv NLP·AI
Az új neuro-szimbolikus architektúra 24%-kal javítja a LLM-ek pontosságát ARC-feladatokban
Kutatás

Az új neuro-szimbolikus architektúra 24%-kal javítja a LLM-ek pontosságát ARC-feladatokban

A rendszer a hagyományos, tisztán neurális hálózatok és a szigorúan szimbolikus rendszerek hiányosságait küszöböli ki, miközben a LLM-eket objektumreprezentációkkal egészíti ki.

ArXiv AI·AI
A LLM mint bíró tanít be kisebb modelleket, címke nélkül
Kutatás

A LLM mint bíró tanít be kisebb modelleket, címke nélkül

Az új RL-keretrendszerrel a kisebb nyelvi modellek képesek felülmúlni a hagyományos, címkézett adatokkal történő betanítást, különösen matematikai feladatoknál.

ArXiv NLP·AI
A XpertBench felrázza a LLM-tesztelést, 1346 feladattal méri a szakértelmet
Kutatás

A XpertBench felrázza a LLM-tesztelést, 1346 feladattal méri a szakértelmet

A 80 kategóriát átfogó adatbázist több mint ezer iparági és kutatói szakértő állította össze, ezzel garantálva a feladatok valósághűségét és relevanciáját.

ArXiv AI·AI
Kizárná a valótlan sztorikat az új RAG-rendszer a kulturális örökség digitalizálásánál
Kutatás

Kizárná a valótlan sztorikat az új RAG-rendszer a kulturális örökség digitalizálásánál

Az új RAG-architektúra a Live Aid koncertről szóló tudásgráfot használta fel a tesztelés során.

ArXiv AI·AI
Felmérés: az amerikaiak 51 százaléka AI-eszközt használ, de a bizalom stagnál
Kutatás

Felmérés: az amerikaiak 51 százaléka AI-eszközt használ, de a bizalom stagnál

1397 amerikai felnőtt megkérdezésével készült felmérés szerint 51 százaléka használ AI-eszközöket, ami 37 százalékos növekedés az egy évvel ezelőtti adatokhoz képest.

The Decoder·AI
Új hálózati modell mérné a szövegek koherenciáját
Kutatás

Új hálózati modell mérné a szövegek koherenciáját

A kutatók egy új, SSN (Sentence/Skeleton Similarity Network) nevű hálózatot javasoltak, amely a szövegkohéziót két mondat közötti konzisztenciával méri.

ArXiv NLP·AI
A PolyJarvis már mondatokból jósol polimer tulajdonságokat
Kutatás

A PolyJarvis már mondatokból jósol polimer tulajdonságokat

A PolyJarvis egy LLM-et és a RadonPy szimulációs platformot kapcsolja össze MCP szervereken keresztül, így automatizálja a teljes előrejelzési folyamatot.

ArXiv NLP·AI
Új módszer felezi a LLM-ek méretét, betanítás nélkül
Kutatás

Új módszer felezi a LLM-ek méretét, betanítás nélkül

A SoLA nevű eljárás a transzformer architektúrájú modellek feed-forward hálózatában (FFN) azonosítja a kulcsfontosságú komponenseket.

ArXiv NLP·AI
57 token előrejelzési ablak mutatja meg a Phi-3-mini viselkedését
Kutatás

57 token előrejelzési ablak mutatja meg a Phi-3-mini viselkedését

A kutatók az új energiaalapú keretrendszerrel a transzformer inferencia dinamikáját vizsgálták, összekötve azt a neurális számítási modellekkel.

ArXiv AI·AI
A TRACE-KG a komplex dokumentumokból is koherens tudásgráfot épít
Kutatás

A TRACE-KG a komplex dokumentumokból is koherens tudásgráfot épít

Az új, multimodális keretrendszer kiküszöböli a fix ontológiák szükségességét, ehelyett adatokból generál sémát a gazdagabb kontextus érdekében.

ArXiv AI·AI
Nagy nyelvi modellek formálják az emberi erkölcsi és spirituális döntéseket
Kutatás

Nagy nyelvi modellek formálják az emberi erkölcsi és spirituális döntéseket

Nagy nyelvi modellek aktívan alakítják az emberi megértést és döntéshozatalt, közvetítenek erkölcsi és spirituális kérdéseket.

ArXiv AI·AI
Holos: A webméretű AI-ügynökrendszerrel lépne szintet az AGI
Kutatás

Holos: A webméretű AI-ügynökrendszerrel lépne szintet az AGI

A rendszer egy ötrétegű architektúrával működik, amelyben a Nuwa motor felel az ügynökök hatékony generálásáért és futtatásáért.

ArXiv AI·AI
Az Alibaba HopChainje 20 teljesítményteszten javítja a látásmodelleket
Kutatás

Az Alibaba HopChainje 20 teljesítményteszten javítja a látásmodelleket

Kutatók az Alibaba-Qwen és a Tsinghua Egyetem közreműködésével a HopChain keretrendszerrel dolgoznak a látás-nyelv modellek fejlesztésén. A cél a komplex vizuális feladatoknál tapasztalt hibák

The Decoder·AI
LLM veri MAS
Kutatás

LLM veri MAS

Egyágens rendszerek információ-hatékonyabbak azonos számítási kapacitással. Felülbecsülik a MAS rendszerek teljesítményét.

ArXiv NLP·AI

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom