Rovat

Biztonság

Jailbreak, hallucination, deepfake, enterprise security, AI risk

193 cikk az archívumban

AI-hamisítások ellen véd a Google új hívásszűrője

A Google új funkciója automatikusan ellenőrzi a bejövő hívásokat, hogy kiszűrje a deepfake AI-alapú csalásokat, amelyek megbízható kontaktoknak adják ki magukat.

TechCrunch·2 órájaAI

Biztonság

Daylight: 100%-os AI-biztonság

A Daylight MDR szolgáltatása mostantól a Claude Enterprise-ra is kiterjed, a vállalatok AI-tevékenységeit folyamatosan monitorozva.

TNW·5 napjaAI

Biztonság

AI-generált hibák lepték el a SQLite fórumát — új fórumot indítottak

A SQLite fejlesztői 2023-ban szigorították a szabályokat, mivel az AI-generált hibajelentések elárasztották a fórumot. Az új fórumon a fejlesztők a minőségi bejegyzések kezelésére koncentrálnak.

Simon Willison·5 napjaAI

Biztonság

Múlt idejű támadással törnek fel a képgeneráló AI-k — 83%-os sikerrátával

A PAST2HARM keretrendszer múlt idejű átfogalmazásokkal támadja a multimodal AI-kat, 83-100%-os sikerrátával törve át a biztonsági korlátokat.

ArXiv NLP·5 napjaAI

Biztonság

22 másodpercre csökkent az AI-támadások sebessége — figyelmeztet a Google Cloud

Az AI-támadások sebessége 8 óra helyett 22 másodpercre csökkent, figyelmeztetett Francis de Souza, a Google Cloud COO-ja. Az árnyék-AI és az elfeledett adatok új védelmi stratégiákat követelnek.

The Decoder·5 napjaAI

Biztonság

Anthropic Mythos AI kormányzati hozzáférése bővül — biztonsági teszteken bukott meg

Az Anthropic a Mythos AI-modellhez való hozzáférést bővíti az Egyesült Államok és szövetséges kormányok számára, miközben a modell biztonsági teszteken bukott meg.

Anthropic·6 napjaAI

Biztonság

AI-hangmásolással vert át nőt a csaló — több ezer dollárt csaltak ki

Egy amerikai anya több ezer dollárt veszített, miután csalók mesterséges intelligenciával klónozták lánya hangját egy hamis túszdrámában, ami egyre gyakoribb bűncselekmény.

Hacker News·6 napjaAI

Biztonság

Anthropic projektje, a Glasswing, 10 000 kritikus hibát fed fel Claude‑val

A Project Glasswing keretében a Claude modell több mint 10 000 kritikus szoftverhibát azonosított egy hónap alatt.

Anthropic·1 heteAI

Biztonság

AI-jal élesztettek fel halott pilóták hangját — a NTSB lezárta adatbázisát

A Nemzeti Közlekedésbiztonsági Hivatal (NTSB) azért vonta meg ideiglenesen a hozzáférést a nyilvános aktarendszeréhez, mert egy UPS-gép balesetében elhunyt pilóták hangját mesterséges intelligencia segítségével rekonstruálták, majd közzétették az interneten.

TechCrunch·1 heteAI

Biztonság

Cyera kiterjeszti AI biztonsági megoldásait az Anthropic Claude Enterprise-re

A Cyera AI biztonsági platformja mostantól az Anthropic Claude Enterprise felhasználói számára is elérhető, célja a vállalati adatok átfogó védelme az AI-modellek használata során.

Anthropic·1 heteAI

Biztonság

Pixelbe rejtett vízjelekkel azonosítja az AI-képeket az OpenAI

Az új megközelítés a képek pixeleibe ágyazott jeleket használ, amelyek ellenállóbbak a manipulációval szemben, mint a korábbi, könnyen eltávolítható metaadatok.

ZDNet AI·1 heteAI

Biztonság

AgentWall: Új futásidejű védelmi réteg a lokális AI-ügynökök biztonságáért

Az új rendszer minden javasolt ügynökműveletet elfog, és explicit, deklaratív szabályok alapján értékeli, mielőtt az a gazdakörnyezetbe jutna.

ArXiv AI·1 heteAI

Biztonság

NVIDIA megerősíti az AI-ügynökök képességeit ellenőrzött készségekkel

A Verified Agent Skills hordozható utasításkészleteket takar, amelyek segítenek a fejlesztőknek megérteni, megbízni és biztonságosan telepíteni az AI-ügynökök képességeit.

Nvidia Developer·2 heteAI

Biztonság

Önálló sandboxokat és MCP-alagutakat kap az Anthropic Claude Managed Agents

Az új funkciókkal a vállalatok saját infrastruktúrájukra helyezhetik át az AI-ügynökök eszközvégrehajtását, miközben az Anthropic továbbra is felügyeli magát az ügynököt.

Anthropic·2 heteAI

Biztonság

Vállalati API-kulcsok szivárgását akadályozza meg az Anthropic új Claude-funkciója

Az önállóan hosztolt sandboxok és a MCP-alagutak a hálózati határhoz helyezik a hitelesítő adatok ellenőrzését, így az ügynökök anélkül hajthatnak végre API-hívásokat, hogy maguknál tartanák a kulcsokat.

VentureBeat·2 heteAI

Biztonság

Kettős védelmet kapnak az OpenAI képei: C2PA metaadat és Google SynthID vízjel érkezik

A mesterséges intelligencia által generált tartalmak hitelességének ellenőrzésére az OpenAI nyilvános ellenőrző eszközt is bemutat, amely mindkét jelzést felismeri.

TechCrunch·2 heteAI

Biztonság

Az Anthropic Mythos AI-ja szélesebb körben oszthatja meg a kibersebezhetőségi adatokat

Az Anthropic Mythos nevű kiberbiztonsági AI-modelljének partnerei mostantól külső biztonsági csapatokkal, iparági szervekkel és szabályozókkal is megoszthatják a talált sebezhetőségeket.

TNW·2 heteAI

Biztonság

A Cloudflare Mythos LLM-je egyetlen exploitba láncolja a biztonsági hibákat

A Cloudflare új, biztonsági fókuszú nagyméretű nyelvi modellje, a Mythos, képes a felfedezett hibákat egyetlen támadási láncba rendezni.

Techmeme·2 heteAI

Biztonság

Anthropic megosztja a Mythos kiberhiba felfedezéseit egy globális pénzügyi felügyelettel

A mesterséges intelligencia startup a Pénzügyi Stabilitási Tanáccsal (FSB) tárgyal a Claude Mythos modell potenciális kiberfenyegetéseiről, amelyek riadalmat keltettek a szakértők körében.

Anthropic·2 heteAI

Biztonság

AI-termékek sebezhetőségeit használták ki a Pwn2Own Berlin 2026 versenyen

A kiberbiztonsági versenyen összesen 47 sebezhetőséget használtak ki sikeresen, rávilágítva az AI-alkalmazások növekvő biztonsági kihívásaira.

Techmeme·2 heteAI

Biztonság

Négy súlyos OpenClaw hiba engedi az adatok lopását és jogosultság-emelést

Az OpenClaw AI-ügynökben felfedezett négy láncolható hiba, a 'Claw Chain', lehetővé teszi a támadók számára, hogy bizalmas adatokat lopjanak, jogosultságokat emeljenek és tartós hozzáférést szerezzenek a kompromittált rendszerekhez.

TNW·2 heteAI

Biztonság

AI-hamisítások ellen véd a Google új hívásszűrője

Daylight: 100%-os AI-biztonság

AI-generált hibák lepték el a SQLite fórumát — új fórumot indítottak

Múlt idejű támadással törnek fel a képgeneráló AI-k — 83%-os sikerrátával

22 másodpercre csökkent az AI-támadások sebessége — figyelmeztet a Google Cloud

Anthropic Mythos AI kormányzati hozzáférése bővül — biztonsági teszteken bukott meg

AI-hangmásolással vert át nőt a csaló — több ezer dollárt csaltak ki

Anthropic projektje, a Glasswing, 10 000 kritikus hibát fed fel Claude‑val

AI-jal élesztettek fel halott pilóták hangját — a NTSB lezárta adatbázisát

Cyera kiterjeszti AI biztonsági megoldásait az Anthropic Claude Enterprise-re

Pixelbe rejtett vízjelekkel azonosítja az AI-képeket az OpenAI

AgentWall: Új futásidejű védelmi réteg a lokális AI-ügynökök biztonságáért

NVIDIA megerősíti az AI-ügynökök képességeit ellenőrzött készségekkel

Önálló sandboxokat és MCP-alagutakat kap az Anthropic Claude Managed Agents

Vállalati API-kulcsok szivárgását akadályozza meg az Anthropic új Claude-funkciója

Kettős védelmet kapnak az OpenAI képei: C2PA metaadat és Google SynthID vízjel érkezik

Az Anthropic Mythos AI-ja szélesebb körben oszthatja meg a kibersebezhetőségi adatokat

A Cloudflare Mythos LLM-je egyetlen exploitba láncolja a biztonsági hibákat

Anthropic megosztja a Mythos kiberhiba felfedezéseit egy globális pénzügyi felügyelettel

AI-termékek sebezhetőségeit használták ki a Pwn2Own Berlin 2026 versenyen

Négy súlyos OpenClaw hiba engedi az adatok lopását és jogosultság-emelést

Anthropic projektje, a Glasswing, 10 000 kritikus hibát fed fel Claude‑val