A rendszer egy ötrétegű architektúrával működik, amelyben a Nuwa motor felel az ügynökök hatékony generálásáért és futtatásáért.
ArXiv AI
215 cikk összesen (szűrt)
A rendszer egy ötrétegű architektúrával működik, amelyben a Nuwa motor felel az ügynökök hatékony generálásáért és futtatásáért.
ArXiv AI
Kutatók az Alibaba-Qwen és a Tsinghua Egyetem közreműködésével a HopChain keretrendszerrel dolgoznak a látás-nyelv modellek fejlesztésén. A cél a komplex vizuális feladatoknál tapasztalt hibák
The Decoder
Egyágens rendszerek információ-hatékonyabbak azonos számítási kapacitással. Felülbecsülik a MAS rendszerek teljesítményét.
ArXiv NLP
Az AutoVerifier hat automatizált lépésben validálja a komplex tudományos állításokat — működését egy kvantumszámítástechnikai tézis sikeres ellenőrzésével szemlélteti a fejlesztőcsapat.
ArXiv AI
Az arXiv-on megjelent tanulmány szerint a LLM-ek már nemcsak megértik, hanem számszerűsítik az emberi szociális logikát — ezt a kutatók az Effect Size Ratio és a Calibration Deviation Score metrikákkal mérik.
ArXiv NLP
Az arXiv-en bemutatott OntoKG a sémát már a tervezéskor ontológiai elemzésekre, entitás-feloldásra és LLM-vezérelt kinyerésre optimalizálja.
ArXiv AI
A DEMASK nevű új módszer egy könnyűsúlyú függőségi előrejelzővel oldja fel a párhuzamos dekódolás problémáját, amely korábban rontotta a kimeneti minőséget.
ArXiv NLP
A kurzus a "Build a Large Language Model (From Scratch)" című könyvéhez készült kiegészítő anyagokból nőtte ki magát, és önálló tartalomként is kiválóan funkcionál.
Ahead of AI
A technológia nem csupán a memóriát csökkenti, hanem a LLM-ek inferencia-költségeit is jelentősen mérsékelheti.
Reddit LocalLLaMA
Legalább ezer annotáció szükséges a megbízható AI-benchmark eredményekhez — feltéve, hogy a költségvetést megfelelően osztják meg a tesztpéldányok és az értékelők között.
The Decoder
Mintegy 300 ép intségű szövegront tartalmazó tekercs várja a megfejtést, de a szakértők szerint évekbe telhet, mire a jelenlegi technikákkal sikerül feltárni tartalmukat.
Understanding AI
A Chip Huyen által végzett elemzés szerint a GitHubon található 900 nyílt forráskódú AI-eszköz közül 845 software repository, és az utóbbi két évben az alkalmazásfejlesztési rétegben történt a legtöbb
Chip Huyen
A Heidy Khlaaf, az AI Now Institute főtudósa szerint az AI használata az iráni légicsapások tervezésében növeli a téves célzások kockázatát.
AI Now Institute
A 2,5 milliárd eurós alapítvány 5 éven keresztül fogja támogatni a fejlesztő országokat, a nyílt forráskódú AI eszközökön alapuló, kevésbé erős AI rendszerekhez való hozzáférést biztosítva.
Future of Life Institute
A lista 11 kategóriába szervezi a kutatási tanulmányokat, beleértve a következtető modelleket, a megerősítési tanulást és a multimodális modelleket — mintegy 200 tanulmányt tartalmaz.
Ahead of AI
A Columbia egyetemi professzor, Mohammed AlQuraishi 2021-ben megalapította az OpenFold projektet, amely nyílt forráskódú fehérje-összehajlási modelleket hozott létre.
Understanding AI
Több mint 30 kutatócikket kategorizált Sebastian Raschka a lista második felében, amelyek a LLM-k fejlesztését és alkalmazását tárgyalják.
Ahead of AI
Az Anthropic szerint a jövőbeni AI-modelleknek a társadalmi jólétet és az egyéni boldogulást kell szem előtt tartaniuk, és ehhez új algoritmusokra és jólétalapú értékelési módszerekre lesz szükség.
The Gradient
A matematikai módszerek a mélytanulásban most inkább a modell betanításának és teljesítményének utólagos magyarázatában játszanak szerepet, hasonlóan ahhoz, mint a fizikában.
The Gradient
Egy nigériai tanulmány szerint a GPT-4 tutorral és tanári irányítással elért eredmények kétszeresen meghaladták a legjobb oktatási intézkedések hatását.
One Useful Thing
A pszichológusok szerint a túl könnyű feladatok megoldása az AI segítségével akadályozhatja a tanulást és a motivációt, mivel a kihívások és a nehézségek fontos szerepet játszanak a fejlődésben — írja
IEEE Spectrum AI
Az OpenAI 13,4 milliárd dolláros befektetési körét követően kezdett átszervezésbe, új projekteket és vezetői pozíciókat alakít ki — írja a Bloomberg.
Techmeme
Az embedding modellek a szavakat és mondatokat folyamatos vektortérbe képezik le, ahol a hasonló jelentésű elemek közel kerülnek egymáshoz – így a keresés nem a pontos szavakra, hanem a szöveg valódi jelentésére alapoz.
Towards Data Science
Ha a modell részt vesz saját kiértékelésében, a mérőszámok torzulnak – ezt a problémát vetette fel Kevin O'Shaughnessy a LessWrong platformon, az Opus 4.6 System Cardot kritizáló elemzésekre hivatkozva.
LessWrong AI
A Ligeia által fejlesztett Simplicity módszer egyetlen szövegkörnyezetben minimalizálja a szóhasználatot és maximalizálja a humor hatását, hogy az LLM-ek rövid, hatásos szövegeket generáljanak.
LessWrong AI
Cormac Slade Byrd, az InkSF mögött álló személy, 2 hónapja tanulmányozza az AI-biztonságot és most San Francisco felé indul, hogy közelebbről figyelemmel kísérje a fejleményeket.
LessWrong AI
A kutatók 3000 szövegalapú munkafeladatot vizsgáltak, és megállapították, hogy az LLM-ek 60%-át minimálisan megfelelő szinten, 26%-át pedig kiváló minőségben tudják elvégezni.
ZDNet AI
A Coefficient Giving nonprofit szervezet több mint 100 millió dollárt irányít biotechnológiai biztonsági projektekre, reagálva az AI által felerősített biológiai fenyegetések kockázatára – a pályázati ablak május 11-én zár.
LessWrong AI
A SimMOF fejlesztői az ArXiv-en osztották meg a projekt részleteit, ami egy nagy nyelvi modell alapú, többszörös ügynök keretrendszer.
ArXiv AI
A GISTBench a felhasználói viselkedés értékeléséhez két új mértékegységet vezet be: az Interest Groundedness (IG) és az Interest Specificity (IS)
ArXiv AI
Öt vezető LLM tesztje szerint a modellek válaszainak 6,5%-ában hallucináció, 13,2%-ában mulasztás vagy kitérő válasz szerepelt – az UTCO-keretrendszerrel 2075 strukturált utasítást vizsgálva.
ArXiv NLP
A kutatók 960 ülést végeztek két modellpárral 15 feladatban, és megállapították, hogy a személyalapú ügynök-bírák értékelései nem különböznek jelentősen az emberi bírákétól.
ArXiv AI
Az ArXiv NLP szerint a kutatók a DeepSeek-R1 sorozatú nagy reasoner modelleket vizsgálták, amelyek erős reasoner képességeket mutatnak a poszt-tréning után.
ArXiv NLP
A kutatók szerint a Connections játék jó teljesítményteszt lesz a nyelvi modellek alapú ügynökök szociális intelligenciájának mérésére
ArXiv AI
A kutatók az OpenTools projektet egy nyilvános webdemón keresztül tesztelték, ahol a felhasználók meghatározott ügynököket és eszközöket futtathatnak és teszteseteket adhatnak hozzá.
ArXiv AI
A kutatás során három 12-14B LLM modellt használtak, köztük a Gemma 3, Phi 4 és Qwen 2.5 modelleket, amelyeket helyi számítógépen futtattak GPU nélkül.
ArXiv NLP
A kurzus az összes érdeklődő számára nyitott, korlátozás nélkül.
Reddit LocalLLaMA
Az LLM-ek értékelésére egyebek között az AWS Bedrock LLM-jét használták a kutatók.
ArXiv NLP
A ClauseCompose dekóder egy könnyen tanítható modell, amely csak egyes szándékokon való betanítást igényel.
ArXiv NLP
A szerző szerint a Prosaic Capture veszélye, hogy az AI safety szakemberek figyelme a termékbiztonsági munkára összpontosul, és elvonja a figyelmet a spekulatívabb kérdésekről.
LessWrong AI
A Midjourney képgenerátorának pontos utasításokat követő képességének hiányára a Tech Xplore oldalán megjelent tanulmány hívja fel a figyelmet
Midjourney
A kutatás az arXiv NLP-n jelent meg, és a T5-alapú érzelem-osztályozót használja az egyetértési stratumok közötti érzelmi eloszlások összehasonlítására.
ArXiv NLP
A Claude Code 9 hónap alatt több mint 2,5 milliárd dolláros árbevételt ért el, az Anthropic pedig továbbra is 10-szeresére növeli az éves árbevételét.
LessWrong AI
Több mint 2 tanulmány idézi a federált tanulás alkalmazását az egészségügyben
Reddit ML
A Reddit-fórumon több mint 150 hozzászólás érkezett a gépi tanulás tankönyveiről szóló kérdésre.
Reddit ML
A cég szerint a CSI 13 perc alatt áttervezte az egész inference stackjüket, és megoldott több, korábban megoldhatatlan anyagtudományi problémát.
LessWrong AI
A tanulmány szerzői, Pablo de los Riscos, Fernando J. Corbacho és Michael A. szerint az új keretrendszer lehetővé teszi az RL, Universal AI és Active Inference architektúrák összehasonlítását.
ArXiv AI
Az ArXiv AI szerint a ChartDiff segíthet a jelenlegi látás-nyelv modellek fejlesztésében, amelyeknek a több diagramos érvelésben való teljesítménye továbbra is kihívást jelent.
ArXiv AI
A CaP-Agent0 rendszer, amely egy vizuális különbségmodullal, automatikusan generált függvénykönyvtárral és párhuzamos kódkészítéssel működik, emberi szintű teljesítményt ért el négy feladatból hétben.
The Decoder
A kutatók szerint a klasszikus adatok kvantum modellekbe történő bevitelének legnagyobb kihívása az adatok hatékony kvantum állapotba történő átalakítása.
Towards Data Science
Tetszik az oldal? Támogasd a fejlesztést
Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.