A Gemma 4 modellcsalád négy modellt tartalmaz, amelyek mindegyike elfér egyetlen NVIDIA H100 GPU-n és támogatja a 140 nyelvet.
Nvidia Developer
1179 cikk összesen
A Gemma 4 modellcsalád négy modellt tartalmaz, amelyek mindegyike elfér egyetlen NVIDIA H100 GPU-n és támogatja a 140 nyelvet.
Nvidia Developer
Az Anthropic 30%-os kedvezményt kínál az extra használati csomagokra, miután kizárja az OpenClaw-t a Claude prémium szolgáltatásából.
Techmeme
A jogi és politikai háttérrel rendelkező munkavállalók az EU AI szabályozási keretének kidolgozásában fognak részt venni.
EU AI Act
A Coefficient Bio csapata, mintegy 10 fő, csatlakozik az Anthropic egészségügyi és élettudományi csapatához
TechCrunch
A vásárlás értéke százmilliókra rúg, de az OpenAI céljai ettől messzebb mutatnak.
Financial Times
Heidy Khlaaf, az AI Now Institute fő AI szakértője szerint a generatív AI biztonsági korlátai jelenleg nem elegendőek a magas kockázatú döntésekhez
AI Now Institute
A Huawei 812 ezer chipet szállított 2025-ben, ezzel a legnagyobb részesedést megszerzve a kínai piacon
The Decoder
A szolgáltatás négy AWS régióban érhető el: US East, US West, Európa és Ázsia
AWS Blog
A Stitch eszközt a Google fejlesztette ki, hogy segítse a fejlesztőket a „vibe design” elkészítésében.
AI Breakfast
A felhasználók a Max tier kvótáit egyes esetekben már 20 perc alatt is elkölthetik.
The Decoder
A DenseNet modellben a feature reuse mechanizmusnak köszönhetően csak k feature mapet számol, és ezeket a meglévő feature mappekkel kombinálja, ami jelentősen csökkenti a paraméterek számát.
Towards Data Science
Az embedding modellek a szavakat és mondatokat folyamatos vektortérbe képezik le, ahol a hasonló jelentésű elemek közel kerülnek egymáshoz – így a keresés nem a pontos szavakra, hanem a szöveg valódi jelentésére alapoz.
Towards Data Science
A KiloClaw platform egy központi vezérlősíkkal rendelkezik, amely lehetővé teszi a biztonsági csapatok számára, hogy azonosítsák, figyeljék és korlátozzák az autonóm ügynököket anélkül, hogy megakadál
AI News
Ha a modell részt vesz saját kiértékelésében, a mérőszámok torzulnak – ezt a problémát vetette fel Kevin O'Shaughnessy a LessWrong platformon, az Opus 4.6 System Cardot kritizáló elemzésekre hivatkozva.
LessWrong AI
Több mint két millió fejlesztő használja hetente a Codexet, a Business és Enterprise felhasználás hatszorosára nőtt január óta
The Decoder
Kutatók egy emberi kogníciót utánzó memóriakeretrendszert javasolnak, amely a komplementer tanulási rendszerek, a kognitív viselkedésterápia és a fuzzy-trace elmélet kombinációjával akár 85%-kal javíthatja az LLM-ek érvelési teljesítményét.
ArXiv NLP
Az új integrációhoz iOS 16.4 vagy újabb operációs rendszer és a legfrissebb ChatGPT alkalmazás szükséges.
ZDNet AI
Az Anthropic az úgynevezett anti-distillation mechanizmust is beépítette, amely hamis eszközökkel próbálja megakadályozni, hogy mások lemásolják a Claude Code-ot.
Hacker News
A Ligeia által fejlesztett Simplicity módszer egyetlen szövegkörnyezetben minimalizálja a szóhasználatot és maximalizálja a humor hatását, hogy az LLM-ek rövid, hatásos szövegeket generáljanak.
LessWrong AI
Minél hosszabb a modell kimenete, annál pontosabb a teljesítménye összetett feladatokon – a Claude Opus 4.5 thinking módban 99%-os pontosságot hozott aritmetikai teszteken az OpenRouter API-n.
LessWrong AI
A Zhipu AI szerint a GLM-5V-Turbo modell vezető eredményeket ért el a multimodális kódolás és GUI ügynök feladatokban.
The Decoder
Cormac Slade Byrd, az InkSF mögött álló személy, 2 hónapja tanulmányozza az AI-biztonságot és most San Francisco felé indul, hogy közelebbről figyelemmel kísérje a fejleményeket.
LessWrong AI
A kutatók 3000 szövegalapú munkafeladatot vizsgáltak, és megállapították, hogy az LLM-ek 60%-át minimálisan megfelelő szinten, 26%-át pedig kiváló minőségben tudják elvégezni.
ZDNet AI
Az E-STEER keretrendszerrel az emberi érzelmi állapotok szabályozhatóvá válnak a számítógépes modellekben, és hatással vannak az objektív érvelésre, a szubjektív generálásra, a biztonságra és a többlé
ArXiv AI
Holden Karnofsky, az Anthropic egyik vezetője, a változásokat szorgalmazta, mondván, a korábbi stratégia hibás volt.
LessWrong AI
A Gmail AI eszköz három prompt segítségével 10 perc alatt feldolgozott olyan mennyiségű információt, amelyhez egyébként 70 óra kutatómunka lett volna szükséges.
ZDNet AI
Az új fejlesztési folyamatban a terminál és az AI együttműködése helyettesíti a hagyományos fejlesztői környezetet.
ZDNet AI
A TBPN talk show átlagosan 70 ezer nézőt vonz epizodonként, és 2025-ben mintegy 5 millió dollár reklámbevételt generált.
The Decoder
Az Anthropic a nemrég felvásárolt Vercept AI technológiájára építette a funkciót, amelyet alig négy héttel az akvizíció után már integrált a Claude Pro, Max és Claude Code termékeibe.
The Decoder
A Coefficient Giving nonprofit szervezet több mint 100 millió dollárt irányít biotechnológiai biztonsági projektekre, reagálva az AI által felerősített biológiai fenyegetések kockázatára – a pályázati ablak május 11-én zár.
LessWrong AI
A SimMOF fejlesztői az ArXiv-en osztották meg a projekt részleteit, ami egy nagy nyelvi modell alapú, többszörös ügynök keretrendszer.
ArXiv AI
A GISTBench a felhasználói viselkedés értékeléséhez két új mértékegységet vezet be: az Interest Groundedness (IG) és az Interest Specificity (IS)
ArXiv AI
Az AI-Mimi tíz soros feliratrendszer – szemben a hagyományos kétsoros megjelenítéssel – valós idejű szövegkövetést biztosít a hallássérültek számára a japán tévécsatornákon.
Microsoft AI
Öt vezető LLM tesztje szerint a modellek válaszainak 6,5%-ában hallucináció, 13,2%-ában mulasztás vagy kitérő válasz szerepelt – az UTCO-keretrendszerrel 2075 strukturált utasítást vizsgálva.
ArXiv NLP
A llama.cpp #21038 PR aktivációs rotációt vezet be a KV cache kvantálásához: a technikával 3 bitre csökkenthető a tárolás szinte nulla pontosságvesztéssel, ami hosszú kontextusú modellekben komoly memória-megtakarítást jelent.
Reddit LocalLLaMA
A Photoroom csapata 32 H200 GPU-t használt, összesen 1500 dollár értékű számítási kapacitást, a modell betanításához.
Hugging Face
A Cohere Command A Vision és Command A Reasoning modellek hozzáadásával az Oracle OCI Generative AI mostantól támogatja a multimodális feldolgozást és a komplex elemzést is.
Cohere
A Qwen 3.6-Plus a harmadik saját modell, amelyet az elmúlt héten adtak ki.
Reddit LocalLLaMA
A Forrester felmérés szerint 91%-a az IT vezetőknek fontosnak tartja az alkalmazások modernizálását az AI előrehaladásához.
Azure Blog
A Claude Marketplace-en elérhető eszközök a vállalatok meglévő Anthropic-kötelezettségével fizethetők
Anthropic
A Cursor 3 az ügynök-átalakítást támogató Composer 2 modelljével is rendelkezik, amely magas használati korlátokkal rendelkezik.
The Decoder
A kiszivárgott kód egy Tamagotchi-szerű kódoló asszisztenst és egy mindig bekapcsolt AI ügynököt is tartalmaz
Anthropic
A Google Gemma 4 modelljének nyílt forráskódú volta lehetővé teszi, hogy akár egy Raspberry Pi eszközön is futtassák, valós idejű döntéshozatalra alkalmas legyen.
Reddit LocalLLaMA
Több mint 1900 belső fájl került nyilvánosságra a szivárogtatás során, ami felveti az adatvédelemmel kapcsolatos aggodalmakat az Anthropicnél.
Anthropic
A Conway ügynököt egy önálló Claude-ügynök környezetben tesztelik, amely kiterjesztéseket, webhookokat és Chrome használatot tartalmaz.
Anthropic
A kutatók 171 érzelmi fogalommal tesztelték a Claude modellt, és azonosítottak olyan mintákat, amelyek az érzelmi reakciókat jellemzik.
Anthropic
A NVIDIA Model Optimizerral és FastNAS Pruninggal optimalizált modell a CIFAR-10 adathalmazon 20-120 építési körrel és 12-120 finomhangolási körrel készül.
MarkTechPost
A kutatók 960 ülést végeztek két modellpárral 15 feladatban, és megállapították, hogy a személyalapú ügynök-bírák értékelései nem különböznek jelentősen az emberi bírákétól.
ArXiv AI
Több mint 10 ezer AI-üzleti vállalkozót szolgálnak ki, és akár 100 ezer dolláros befektetést is nyújthatnak
Product Hunt
Az ArXiv NLP szerint a kutatók a DeepSeek-R1 sorozatú nagy reasoner modelleket vizsgálták, amelyek erős reasoner képességeket mutatnak a poszt-tréning után.
ArXiv NLP
Tetszik az oldal? Támogasd a fejlesztést
Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.