OpenAI nyílt forráskódú Privacy Filter modellje 128 k tokenes átfutással jelöli a PII‑t
A fejlesztők mostantól beépíthetik a nyílt forráskódú Privacy Filter modellt webes szolgáltatásaikba, amely egyetlen 128 000 tokenes átfutással jelöli ki a személyes adatokat.

Az OpenAI a Hub-on közzétette a 1,5 milliárd paraméteres Privacy Filter modellt, amely 50 millió aktív paraméterrel működik, és Apache 2.0 licenc alatt áll — írja a Hugging Face.
A személyes adatok nyomon követése
A modell nyolc PII‑kategóriát – private_person, private_address, private_email, private_phone, private_url, private_date, account_number, secret – képes egyetlen előrehaladással felismerni, a kontextus pedig 128 000 token.
Élő bemutatók a Gradio‑Serverrel
Három bemutatott alkalmazás – Document Privacy Explorer, Image Anonymizer és SmartRedact Paste – mind Gradio.Server és a gradio_client SDK segítségével fut, így a fejlesztők könnyen testreszabhatják a frontendet anélkül, hogy a modellhívásokat duplikálnák.
Úgy tűnik, a modell csúcsteljesítményű a PII‑Masking‑300k teljesítményteszten, bár a mérőszámok független ellenőrzését még nem publikálták.
A Privacy Filter modell bevezetése 2026. április 27-én történt a Hugging Face Hub-on.