ÉlőUtoljára: 9 perceMa: 5
Modellek & LLMfrissítve: 15:50

OpenAI nyílt forráskódú Privacy Filter modellje 128 k tokenes átfutással jelöli a PII‑t

A fejlesztők mostantól beépíthetik a nyílt forráskódú Privacy Filter modellt webes szolgáltatásaikba, amely egyetlen 128 000 tokenes átfutással jelöli ki a személyes adatokat.

OpenAI nyílt forráskódú Privacy Filter modellje 128 k tokenes átfutással jelöli a PII‑t
Fotó: Fotó: Jakub Żerdzicki / Unsplash
forrás: Hugging Face·AI Forradalom szerk.·
Megosztás

Az OpenAI a Hub-on közzétette a 1,5 milliárd paraméteres Privacy Filter modellt, amely 50 millió aktív paraméterrel működik, és Apache 2.0 licenc alatt áll — írja a Hugging Face.

A személyes adatok nyomon követése

A modell nyolc PII‑kategóriát – private_person, private_address, private_email, private_phone, private_url, private_date, account_number, secret – képes egyetlen előrehaladással felismerni, a kontextus pedig 128 000 token.

Élő bemutatók a Gradio‑Serverrel

Három bemutatott alkalmazás – Document Privacy Explorer, Image Anonymizer és SmartRedact Paste – mind Gradio.Server és a gradio_client SDK segítségével fut, így a fejlesztők könnyen testreszabhatják a frontendet anélkül, hogy a modellhívásokat duplikálnák.

Úgy tűnik, a modell csúcsteljesítményű a PII‑Masking‑300k teljesítményteszten, bár a mérőszámok független ellenőrzését még nem publikálták.

A Privacy Filter modell bevezetése 2026. április 27-én történt a Hugging Face Hub-on.

tetszett a cikk? oszd meg →
Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom