Modellek & LLM2026. ápr. 27.frissítve: 15:50

OpenAI nyílt forráskódú Privacy Filter modellje 128 k tokenes átfutással jelöli a PII‑t

A fejlesztők mostantól beépíthetik a nyílt forráskódú Privacy Filter modellt webes szolgáltatásaikba, amely egyetlen 128 000 tokenes átfutással jelöli ki a személyes adatokat.

Fotó: Fotó: Jakub Żerdzicki / Unsplash

forrás: Hugging Face·AI Forradalom szerk.·2026. április 27.

Megosztás

Az OpenAI a Hub-on közzétette a 1,5 milliárd paraméteres Privacy Filter modellt, amely 50 millió aktív paraméterrel működik, és Apache 2.0 licenc alatt áll — írja a Hugging Face.

A személyes adatok nyomon követése

A modell nyolc PII‑kategóriát – private_person, private_address, private_email, private_phone, private_url, private_date, account_number, secret – képes egyetlen előrehaladással felismerni, a kontextus pedig 128 000 token.

Élő bemutatók a Gradio‑Serverrel

Három bemutatott alkalmazás – Document Privacy Explorer, Image Anonymizer és SmartRedact Paste – mind Gradio.Server és a gradio_client SDK segítségével fut, így a fejlesztők könnyen testreszabhatják a frontendet anélkül, hogy a modellhívásokat duplikálnák.

Úgy tűnik, a modell csúcsteljesítményű a PII‑Masking‑300k teljesítményteszten, bár a mérőszámok független ellenőrzését még nem publikálták.

A Privacy Filter modell bevezetése 2026. április 27-én történt a Hugging Face Hub-on.

tetszett a cikk? oszd meg →

Megosztás