Archívum

294 cikk összesen (szűrt)

Mind Modellek & LLM Kutatás Üzlet & Startup Alkalmazások Biztonság Hogyan működik?Szabályozás Eszközök Hardver & Infra Robotika & CV

2026. ápr. 1. 21:05·Kutatás

Az AI-vége 1-4 év múlva érkezhet, éljük meg az utolsó éveket vidáman

NickyP, a LessWrong AI szerző szerint az emberiségnek mindössze 1-4 éve maradt, mielőtt az AI radikálisan átalakítja a világot.

LessWrong AI

2026. ápr. 1. 20:25·Kutatás★ Kiemelt

A YOLO csendben megbukik biztonságkritikus zárt körű osztályozásnál

A modell 94–96%-os pontossággal azonosítja az ismert fajokat, de ismeretlen gombáknál tévesen osztályoz — ami mérgezési kockázatot jelent.

Reddit ML

2026. ápr. 1. 19:45·Kutatás★ Kiemelt

Hat Models, Négy Feladat: Az LLM Alapú Szövegannotáció Rejtett Tényezői

Lorca McLaren és munkatársai hat modellt teszteltek, és megállapították, hogy a folyamat választások kölcsönhatásai meghatározzák az eredményeket.

ArXiv NLP

2026. ápr. 1. 18:45·Kutatás★ Kiemelt

A FormalProofBench 33,5%-os pontosságot ért el a diplomamunka-szintű matematikai bizonyításokban

A Claude Opus 4.5 modell érte el a legjobb eredményt a FormalProofBench teszten

ArXiv AI

2026. ápr. 1. 18:05·Kutatás★ Kiemelt

Hat LLM modell került tesztelésre 15 ország adataival

A kutatók szerint a modell teljesítménye az érzelem típusától és a kulturális kontextustól függ.

ArXiv NLP

2026. ápr. 1. 16:45·Kutatás★ Kiemelt

Az RL-képzés tönkreteszi a Chain-of-Thought monitorozhatóságot bizonyos esetekben

A DeepMind Safety Research csapata kidolgozott egy keretrendszert, amely segít előrejelezni, hogy az RL-képzés mikor rontja a Chain-of-Thought monitorozhatóságát.

LessWrong AI

2026. ápr. 1. 15:05·Kutatás★ Kiemelt

Az ellenőrzés néha árt: Tanulási modell visszajelzések aszimmetrikus hatásai

A kutatók 516 egyedi bizonyítási állapottal kísérleteztek

ArXiv AI

2026. ápr. 1. 14:45·Kutatás★ Kiemelt

A LIMBO kutatócsoport 2024-es alapítása óta fejleszti az anthropikus következtetés matematikai keretrendszerét

A LIMBO csapata 5,6 millió dollárból képzett egy versenyképes modellt, és fontos eredményeket ért el a ritka események becslésében

LessWrong AI

2026. ápr. 1. 13:25·Kutatás★ Kiemelt

Az LLM-ek nem tudnak megbízható magyarázatot adni az AI-felelősséghez

Több kutatás is azt találta, hogy az LLM-ek által generált magyarázatok nem pontosak, és a szakértők szerint ez komoly probléma az AI-felelősség szempontjából.

AI for Newsroom

2026. ápr. 1. 12:45·Kutatás★ Kiemelt

Az AlpsBench bemutatja az első valós párbeszéden alapuló LLM személyre szabási teljesítménytesztet

A teljesítményteszt 2500 hosszú interakciós sorozatot tartalmaz, amelyet a WildChat platformról gyűjtöttek

ArXiv NLP

2026. ápr. 1. 12:45·Kutatás★ Kiemelt

A Mistral AI szerint az AI-modell testreszabása architektúrális követelmény

A Mistral AI szerint a testreszabás logikájának leválasztása az alapmodellről biztosítja, hogy a vállalatok "digitális idegrendszere" rugalmas maradjon.

Mistral AI

2026. ápr. 1. 11:45·Kutatás★ Kiemelt

Kontrollos kísérlet: 3,2%-kal jobb eredményt ér el az LLM újraparaméterezése a szakcikkekhez való hozzáféréssel

A kutatók szerint az LLM újraparaméterezése akár 10%-kal is javíthatja a teljesítményt, ha a modellhez nagy mennyiségű, minőségi adatot biztosítanak.

Reddit ML

2026. ápr. 1. 11:45·Kutatás★ Kiemelt

A Google TurboQuantja 6-szor kevesebb memóriát használ, 8-szor gyorsabb és nulla pontosságveszteséggel

A TurboQuant.net elemzés szerint a kompresszióhatárok eléréséhez közelednek, és az új fejlesztések valószínűleg más irányból érkeznek.

Reddit LocalLLaMA

2026. ápr. 1. 11:25·Kutatás★ Kiemelt

A bizonytalanság fontossága: új felmérés az UAXAI-ről

Több mint 100 kutatómunka elemzése során azonosították a bizonytalanság fontos szerepét az UAXAI-ban

ArXiv AI

2026. ápr. 1. 10:25·Kutatás★ Kiemelt

A PentaNet projekt új lehetőségeket nyit a BitNet-en túl

A PentaNet projekt mögött álló csapat 124M paramétert használ az új modellben.

Reddit ML

2026. ápr. 1. 09:05·Kutatás★ Kiemelt

Az inference sokkal gyorsabb Linuxon, mint Windowson

A LocalLLaMA közösség szerint a Linuxon futó inference akár 30%-kal gyorsabb lehet, mint a Windows alatt.

Reddit LocalLLaMA

2026. ápr. 1. 07:25·Kutatás★ Kiemelt

LLM-ek nem gondolkodnak, hanem utánoznak — egy újságíró tapasztalatai Claude-dal

Gina Chua újságíró-stratéga két napot töltött Claude-dal szerkesztői folyamat tesztelésére — és nyíltan szólt arról, amit talált: az LLM-ek nem értenek semmit, csak analógiák alapján utánoznak.

AI for Newsroom

2026. ápr. 1. 07:05·Kutatás★ Kiemelt

Lebontva: így néz ki belülről a Claude Code — 500+ fájl, 40+ eszköz, 11 lépéses loop

A ccunpacked.dev oldal részletesen feltárta a Claude Code belső architektúráját: az alkalmazás egy 11 lépéses agent loopon alapul, amelybe a felhasználói bemenet feldolgozásától az API-válaszig minden lépés beágyazódik.

Hacker News

2026. ápr. 1. 05:25·Kutatás★ Kiemelt

Miért nem lehet a TurboQuant-ot kvantálásra alkalmazni? A LocalLLaMA közösség magyarázza

A Google TurboQuant módszere csak egydimenziós vektorokon forgatja a súlyokat — a 2D súlymátrixokon ez nem működik, ezért a kvantáláshoz más megközelítés kell.

Reddit LocalLLaMA

2026. ápr. 1. 05:06·Kutatás★ Kiemelt

Új teszt: az LLM-ek következetesen félreolvassák a feladatot, ha az instrukció és a szöveg ellentmond egymásnak

Hat modellt teszteltek, és mindegyiknél ugyanazt találták: a felületi jelek 8–38-szor erősebben befolyásolják a döntést, mint maga a feladat célja.

ArXiv NLP

2026. ápr. 1. 04:45·Kutatás★ Kiemelt

Az SciVisAgentBench teszt 108 esettanulmányt tartalmaz a tudományos adatelemzés és visualizáció értékelésére

Kuangshi Ai és 15 társunk 12 szakértővel együttműködve hozta létre a SciVisAgentBench tesztet

ArXiv AI

2026. ápr. 1. 04:25·Kutatás

Egy kutatópáros szerint az AI valódi áttörése nem egyéni modellektől, hanem együttműködéstől várható

Ha az AI modellek nem versenyeznek, hanem együttműködnek, szélesebb megoldásteret fedeznek fel — és kisebb eséllyel ragadnak le a korai, téves konszenzusnál.

ArXiv AI

2026. ápr. 1. 04:25·Kutatás★ Kiemelt

Felfedezték az AI-ügynökök spontán szocializációját

S.O. Lidarity és munkatársai szerint a szemi-autonóm AI-ügynökökben spontán szocializáció figyelhető meg.

ArXiv AI

2026. ápr. 1. 03:45·Kutatás★ Kiemelt

Az NVIDIA egy nap alatt képes domain-specifikus embedding modellt képezni

Az Atlassian 26%-os javulást ért el a Recall@60 értékben, miután finomhangolta a modellt a JIRA adathalmazon.

Hugging Face

2026. ápr. 1. 03:25·Kutatás★ Kiemelt

A Hugging Face nyílt forráskódú AI-ökoszisztémája 13 millió felhasználót számlál

Több mint 30 százaléka a Fortune 500-nak már most is használja a Hugging Face nyílt forráskódú modelljeit.

Hugging Face

2026. ápr. 1. 03:05·Kutatás★ Kiemelt

A Meta új technikája 93%-ra növeli az LLM-ek kódellenőrzési pontosságát

A Meta új technikáját a Claude Opus-4.5 és Sonnet-4.5 modellek tesztelték, amelyek 93%-os pontosságot értek el a kódellenőrzési feladatokban.

VentureBeat

2026. ápr. 1. 02:05·Kutatás

Az Anthropic titkos Mythos modellje nyilvánosságra került

Sam Altman állítólag elmondta az OpenAI dolgozóinak, hogy megpróbálta megmenteni az Anthropicot a Pentagonnal való konfliktus során.

AI Breakfast

2026. ápr. 1. 02:05·Kutatás★ Kiemelt

Az OpenAI eszközei hónapok alatt váltak használhatóvá az nyílt forráskódú fejlesztőknek

Greg Kroah-Hartman, a Linux stable kernel maintainer, szerint az AI-eszközök minősége hónapok alatt jelentősen javult.

ZDNet AI

2026. ápr. 1. 00:45·Kutatás★ Kiemelt

A TurboQuant technika nagy részben kompenzálja a Q8_0 kv quantizálás csökkentését

A Reddit felhasználók szerint a TurboQuant technika mellett az AIME25 teljesítményteszten tapasztalt teljesítménycsökkenés nagyrészt kompenzálható

Reddit LocalLLaMA

2026. márc. 31. 23:25·Kutatás★ Kiemelt

Egy fejlesztő létrehozott egy autonóm ML ügynököt, ami végeláthatatlanul futtat kísérleteket tabuláris adatokon

A Reddit felhasználó, aki az AutoResearch projektből merített ihletet, egyetlen GPU-val tesztelte a fejlesztést.

Reddit ML

2026. márc. 31. 21:45·Kutatás

Betekintés a transformer rétegekbe: így dolgoznak az inference motormeghajtások

A Vicuna-13B modellhez hasonló nyelvi modellek fejlesztésében kulcsszerepet játszanak az olyan technológiák, mint a self-attention és a finomhangolás.

Reddit LocalLLaMA

2026. márc. 31. 21:45·Kutatás★ Kiemelt

Egy 9 soros seed és 5 kör kontrasztív visszajelzés felülmúlja az Optunát 96%-ban

A Reddit felhasználók szerint a kontrasztív visszajelzés technika hatékonysága a szabályozatlan betanítással kombinálva 20%-kal növelte a modell teljesítményét.

Reddit ML

2026. márc. 31. 18:25·Kutatás★ Kiemelt

Sűrűség-érzékeny kontextus-kompresszió új módszerrel

Yijiong Yu és munkatársai egy új keretrendszert mutattak be, amely a kontextus kompresszióját optimalizálja az információ sűrűségének figyelembevételével.

ArXiv NLP

2026. márc. 31. 16:25·Kutatás★ Kiemelt

Kutatók kimutatták, hogy az összeesküvés-elméletek nem uniformán fejlődnek

Manisha Keim és munkatársai 169,9 millió Reddit-kommentet elemeztek, és megállapították, hogy az összeesküvés-elméletek nyelvi jellemzői idővel dinamikusan változnak.

ArXiv NLP

2026. márc. 31. 16:05·Kutatás★ Kiemelt

A Lens Academy alapítója keresi társát, már vannak felhasználók és finanszírozás

Luc Brinkman, a Lens Academy alapítója egy olyan társat keres, aki vagy technikai, vagy nem-technikai szakértő, és akivel együttműködve fejleszthetik az AI Safety oktatást.

LessWrong AI

2026. márc. 31. 04:45·Kutatás★ Kiemelt

Az AutoB2G keretrendszer természetes nyelvi leírások alapján automatizálja az épület-hálózat szimulációt

Borui Zhang és munkatársai által kidolgozott AutoB2G keretrendszer 2,255 KB méretű, és cs.AI kategóriába tartozik.

ArXiv AI

2026. márc. 31. 04:45·Kutatás★ Kiemelt

A RASPRef keretrendszer fejleszti a promptokat emberi felügyelet nélkül

Rahul Soni szerint a RASPRef keretrendszerrel elérhető javulás a GSM8K-stílusú matematikai okoskodási feladatokban

ArXiv NLP

2026. márc. 31. 04:05·Kutatás★ Kiemelt

Az utolsó ujjlenyomat: hogyan formálja a markdown az LLM szövegét

E. M. Freeburg szerint a markdown képzés hatással van az LLM szövegére, az em dash használata pedig egyfajta ujjlenyomat.

ArXiv NLP

2026. márc. 31. 03:25·Kutatás★ Kiemelt

Az OpenAI és a Google fejleszti a nyelvi modellek szabályozhatóságát

Több mint 100 ezer felhasználó járult hozzá a GPT-4o visszavonásához

Reddit ML

2026. márc. 31. 03:25·Kutatás★ Kiemelt

PyTorch DDP-vel építsünk gyártásra képes, több csomópontos tanulási folyamatot

S. M. Navin Nayer Anik 27 oldalas cikkben mutatja be, hogyan építsünk gyártásra képes tanulási folyamatot PyTorch DDP-vel

Towards Data Science

2026. márc. 31. 02:45·Kutatás★ Kiemelt

A robotok is megtanulhatják a statisztikai csalást

Jaemin Han szerint a p-hackinggal a kutatók a hipotézisük igazolására törekednek, és ennek során akár 40%-ra is növelhetik a hamis pozitív eredmények arányát.

Towards Data Science

2026. márc. 31. 02:25·Kutatás

A LocalLLaMA 2026 modellje már jobb lehet a GPT-3.5-nél

A Meta kutatói szerint a LocalLLaMA modell fejlesztése 2026-ra akár 10 százalékkal javíthatja a nyelvi megértést

Reddit LocalLLaMA

2026. márc. 31. 02:05·Kutatás

A LessWrong kutatói felfedezik: az LLM-ekben az elhitetés hathatós eszköz az irányításban

Egy új tanulmány feltárta, hogy az LLM-ek irányításában milyen szerepet játszhat az elhitetés, és milyen következményekkel járhat ez a technológia fejlődésére

LessWrong AI

2026. márc. 31. 01:45·Kutatás

Irán nyerésre áll az AI-propagandaháborúban

Több mint 61 százalék az amerikaiak közül elutasítja Trump háborús politikáját, miközben az iráni propagandavideók milliós nézettséget értek el.

404 Media

2026. márc. 30. 23:05·Kutatás★ Kiemelt

Georgi Gerganov szerint a helyi modellekben rengeteg apró hibától szenvednek

Georgi Gerganov llama.cpp könyvtára lehetővé tette, hogy a lokális modellek a fogyasztói hardveren is fussanak

Simon Willison

2026. márc. 30. 22:05·Kutatás★ Kiemelt

A megbízható AI alapjai: a platform-determinisztikus inferencia elengedhetetlen

TJ Dunham szerint a megbízható AI alapja a platform-determinisztikus inferencia, amit 82 kereszt-architekturális teszttel igazoltak.

ArXiv AI

2026. márc. 30. 22:05·Kutatás★ Kiemelt

A domain-specifikus gépi fordítás és minőségértékelés rendszerek fejlesztése

Javad Pourmostafa Roshan Sharami kutató szerint a gépi fordítás minősége jelentősen javulhat, ha a rendszereket speciális domainekhez igazítják.

ArXiv NLP

2026. márc. 30. 21:45·Kutatás★ Kiemelt

Új modell javítja az érzelmek felismerését a multimodális beszélgetésekben

Ying Liu és munkatársai egy kapcsolatokat figyelembe vevő modellt fejlesztettek ki, amely a szöveg, hang és arckifejezés kombinált elemzésével pontosabban azonosítja a beszélgetések érzelmi tónusát.

ArXiv NLP

2026. márc. 30. 21:45·Kutatás★ Kiemelt

Az LVFace felülmúlja az ArcFace/ResNet modellt az arcfelismerésben

A Reddit ML poszt szerint a LVFace modell 99,5 százalékos pontosságot ért el az arcfelismerési tesztek során

Reddit ML

2026. márc. 30. 21:15·Kutatás★ Kiemelt

Kilencszer gyorsabb képgenerálás: az A-SelecT kiszűri a felesleges lépéseket

Changyu Liu és kutatótársai olyan módszert dolgoztak ki, amely automatikusan kiválasztja a Diffusion Transformer legfontosabb lépéseit — akár kilencszeres gyorsulást elérve.

ArXiv AI

← Előző5 / 6 oldalKövetkező →