Helyben futó adateltávolító modellt adott ki az OpenAI — 1,5 milliárd paraméterrel
A modell nyolc kategóriába tartozó érzékeny adatot képes felismerni és eltávolítani, beleértve a neveket, címeket és jelszavakat.

Nyílt forráskódú AI modellt adott ki az OpenAI, amely automatikusan anonimizálja a szöveges adatokat, mielőtt azokat tovább feldolgoznák. A Privacy Filter nevű eszköz helyben fut, így a személyes adatok sosem hagyják el a felhasználó eszközét — írja a The Decoder.
A Privacy Filter 1,5 milliárd paraméterrel rendelkezik, de kérésenként mindössze 50 millió aktív paramétert használ, így laptopon vagy akár böngészőben is futtatható az OpenAI szerint. A modell nyolc kategóriába sorolja a bizalmas információkat, mint például nevek, címek, e-mail címek, telefonszámok, URL-ek, dátumok, számlaszámok és jelszavak.
Az adatvédelem új dimenziója
A hagyományos chatbotokkal ellentétben a Privacy Filter nem generál új szöveget, hanem egyetlen átfutással jelöli meg és távolítja el a releváns részeket. Az OpenAI szerint a 128 000 tokenes kontextusablak lehetővé teszi hosszú dokumentumok feldolgozását felosztás nélkül.
A modell szabályozhatósága
A felhasználók szabályozhatják az anonimizálás érzékenységét, és a modell finomhangolható saját adathalmazokkal. A Privacy Filter az Apache 2.0 licenc alatt érhető el a GitHubon és a Hugging Face-en, kereskedelmi célra is használható.
Az OpenAI hangsúlyozza, hogy a modell nem garantálja a jogilag megfelelő anonimizálást, és emberi felülvizsgálatot javasol különösen érzékeny esetekben, például az egészségügyben vagy a pénzügyben. A modell teljesítménye csökkenhet nem angol nyelvű vagy nem latin írású szövegek esetén, például 2024. január elsejétől kezdve.