Az ArXiv AI szerint a ChartDiff segíthet a jelenlegi látás-nyelv modellek fejlesztésében, amelyeknek a több diagramos érvelésben való teljesítménye továbbra is kihívást jelent.
ArXiv AI
1195 cikk összesen
Az ArXiv AI szerint a ChartDiff segíthet a jelenlegi látás-nyelv modellek fejlesztésében, amelyeknek a több diagramos érvelésben való teljesítménye továbbra is kihívást jelent.
ArXiv AI
A Mistral AI szerint a Forge segítségével a vállalatok saját adataik felhasználásával építhetik fel AI-modelljeiket, megőrizve az irányítást és elkerülve a külső adatmegosztást.
Mistral AI
A Voxtral TTS a Mistral AI számára egy teljes körű beszédfelismerési és -szintetizálási megoldást jelent, amely a Voxtral Transcribe és más eszközökkel együttműködik.
ElevenLabs
Több mint 8 ezer jogos GitHub-forkot érintett a túlzott leszedés
Ars Technica
A PAR²-RAG modell a négy tesztben is folyamatosan felülmúlta a korábbi legjobb eredményeket.
ArXiv AI
A CaP-Agent0 rendszer, amely egy vizuális különbségmodullal, automatikusan generált függvénykönyvtárral és párhuzamos kódkészítéssel működik, emberi szintű teljesítményt ért el négy feladatból hétben.
The Decoder
A Qwen3.6-Plus modell integrálásra kerül a Qwen chatbot alkalmazásba és az új vállalati AI szolgáltatásba, a Wukongba.
The Decoder
Az Nvidia 2,7-szörös teljesítménynövekedést ért el a DeepSeek-R1 modellben szoftveroptimalizációkkal, a hardver változatlanul hagyása mellett.
The Decoder
Megan Davis szerint a szigorú hozzáférés- és adatkezelési irányelvek betartása az egyik legfontosabb lépés az AI rendszerek biztonságának megőrzése érdekében.
AI News
A keresetet egy Utah-i férfi nyújtotta be április 1-jén, a San Francisco-i szövetségi bíróságon.
Perplexity
A kutatók szerint a klasszikus adatok kvantum modellekbe történő bevitelének legnagyobb kihívása az adatok hatékony kvantum állapotba történő átalakítása.
Towards Data Science
Több mint 2.1 ezer csillagot gyűjtött össze a Lemonade projekt a GitHubon, ahol a fejlesztők és a felhasználók együttműködnek a további fejlesztésen.
Hacker News
Az ANYbotics és az SAP együttműködésével a robotszolgáltatások és a vállalati erőforrás-tervezési szoftverek közötti kapcsolat új szintre lép, és a fizikai AI-t ipari környezetben valós idejű adatgyűj
AI News
Az NSW és Victoria államok felelősek az országos Claude-használat 68%-áért
Anthropic
A kutatók szerint a média szervezeteknek az egyedi értékelésükre kell összpontosítaniuk, és automatizálniuk kell mindent, ami nem fér bele az emberi vezetésű értékelési dobozba.
AI for Newsroom
A CrossTrace adathalmaz 1389 darab, tudományosan megalapozott okoskodási nyomot tartalmaz, amelyek három különböző területen oszlanak meg: biomedicina, AI/ML és többterületű munka.
ArXiv NLP
Egy felhasználó, John Doe állítja, hogy családi pénzügyeiről, adóinformációról és személyes befektetési stratégiákról is beszélt a chatbotnak.
Perplexity
Több kutató, köztük Yann LeCun és Demis Hassabis, vitatja az OpenAI álláspontját, és úgy gondolják, hogy a nagy nyelvi modellek önmagukban nem elegendőek az általános intelligencia eléréséhez.
The Decoder
A Microsoft modelljeihez kevesebb mint 10 fős csapatok dolgoztak, akik az iparág legjobb eredményeit érték el.
VentureBeat
A Duck.ai-nál a felhasználók anonimizált lekérdezéseket adhatnak le, és a chatbot nem használja fel a felhasználók adatait a modellek fejlesztésére.
ZDNet AI
A Mimosa Framework nyílt forráskódú, az Apache License 2.0 alatt érhető el.
ArXiv AI
A TAC módszer a nyílt forráskódú és kevés adatos felügyelet mellett is képes jól kalibrált bizonytalansági becsléseket adni.
ArXiv AI
Az xAI modellje hatékonyabban képes kezelni a matematikai feladatokat, például a moduláris aritmetikát és a vegyes műveleteket.
Reddit ML
A kínai Z.ai bemutatta a GLM-5V-Turbo modellt: 200 000 tokenes kontextusablak, megerősítéses tanulással fejlesztve, STEM-oktatástól videóanalízisig 30 feladattípust kezel.
MarkTechPost
Az AgentScope lehetővé teszi, hogy egyéni eszközökkel — például számológéppel és dátumkezelővel — felszerelt autonóm ügynököket hozzunk létre néhány sornyi kóddal.
MarkTechPost
A kutatók 50 TruthfulQA tesztesetet használtak — a Claude Sonnet 4 behódolási aránya mindössze 2%-ra esett a Silicon Mirror alkalmazásával.
ArXiv AI
Jeff Dean, a Google AI-részlegének vezetője szerint a programozás továbbra is alapvető készség marad — még ha az AI-rendszerek egyre többet is átvesznek a rutinfeladatokból.
The Batch
A Qwen csapat hibrid figyelemmechanizmust és MoE-architektúrát ötvöző új modellt mutatott be, amely a Claude 4.6 Opus gondolkodási mintáit sajátította el.
Reddit LocalLLaMA
A SmolLM2-360M modell mindössze 380 MB RAM-ot igényel a llama.cpp-ban — elég kis méretű ahhoz, hogy akár egy Samsung Galaxy Watch 4 okosórán is fusson.
Reddit LocalLLaMA
A kutatás szerint az AI-ügynökök teljesítménye jelentősen javul, ha hozzáférnek a Slack munkafelületéhez — a tesztek ezt zöld jelzéssel igazolták.
LessWrong AI
A Gemma 3 1B Instruct modellhez a Hugging Face Transformers és a Colab Inference keretrendszerét használják a termelési környezetben való használatra.
MarkTechPost
Az Anthropic megerősítette, hogy a nyilvánosságra került forráskód nem tartalmazott ügyféladatokat vagy hitelesítő kulcsokat.
Anthropic
Több mint 8000 leszedési kérelmet adott be az Anthropic a GitHubon megjelent Claude kódolási eszköz másolatai és adaptációi ellen.
Anthropic
A döntés mögött az áll, hogy a felhasználók egyre több LLM-vel generált kódot osztanak meg anélkül, hogy egyértelműen feltüntetnék a forrást.
Hacker News
A WAM modell a CALVIN teljesítményteszt 8 manipulációs feladatán tesztelték, ahol a DreamerV2 és DiWA alapmodellhez képest javította a viselkedési klónozás sikerét.
ArXiv AI
A kutatók 25 ezer feladatot tartalmazó kísérletet végeztek, amelyben 8 modellt és 4-256 ügynököt használtak, és megfigyelték, hogy az ön szerveződő LLM-ügynökök már jelenleg is képesek specializált sz
ArXiv AI
A Meta Superintelligence Laborjának új AI modellei fejlesztésében olyan szakemberek vettek részt, mint Alexandr Wang, a Scale AI alapítója.
Meta AI
A kutatók szerint az EVOM keretrendszerrel való munka során a szabályozási feladatok megoldásához nincs szükség folyamatszintű felügyeletre.
ArXiv AI
A kutatók egy natív harmony agent harness-t is kifejlesztettek, amely lehetővé teszi a modell natív formátumának használatát.
ArXiv AI
Az LLM-ek figyelmi ablakának növekedése együtt jár a humán fenntartott figyelem képességének csökkenésével, amely 2004 és 2026 között mintegy 16 000-ről 1800 tokentre csökkent.
ArXiv NLP
Az ElevenLabs hangklónozásának használata csak a Starter csomagot vagy annál magasabb szintű előfizetők számára érhető el.
ElevenLabs
A PolarQuant a Qwen3.5-9B perplexity értékét 6.90-ről 6.40-re csökkenti
ArXiv NLP
A GitHub Copilot a leggyorsabb inline kiegészítést és a legszélesebb IDE-támogatást nyújtja.
Cursor
A kutatók kimutatták, hogy a biztonsági finomhangolás csökkenti az LLM-ek hajlamát, hogy elismerjék az állatok mentális állapotát
ArXiv NLP
A Google-kutatók DeepSeek-R1 és QwQ-32B modelleken végzett vizsgálata kimutatta, hogy az LLM-ek komplex, többszereplős belső gondolkodást szimulálnak — ez különböző kognitív folyamatokat és perspektívákat tesz lehetővé egy modellen belül.
Import AI
A Tshepo Tshabalala által végzett elemzés szerint a havi 34 750 dollárt is elérheti egy AI-projekt menedzser költsége nyolc hónapra.
AI for Newsroom
A szerző szerint az AI által nyújtott termelékenység-növekedés nem inkrementális, hanem exponenciális, és az analitikusoknak alkalmazkodniuk kell ehhez a változáshoz.
Towards Data Science
A vád szerint az adatok továbbítása automatikusan történik, és nem csak a Meta és a Google, hanem más harmadik felek is érintettek.
Perplexity
Az OptiMer a Gemma 3 27B modellen végzett kísérletek során egyaránt felülmúlta a hagyományos adatkeverést és a modellátlagolást japán, kínai nyelveken és matematika, kódolás területeken.
ArXiv NLP
A kódlekérés komoly biztonsági kockázatot jelent, mivel a versenytársak könnyebben tudják visszafejteni a Claude Code-ot, és a hackerek is könnyebben találhatnak rá a szoftver sebezhetőségeire.
Anthropic
Tetszik az oldal? Támogasd a fejlesztést
Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.