ÉlőUtoljára: 21 perceMa: 21
Alkalmazásokfrissítve: 16:10

Helyben futó adateltávolító modellt adott ki az OpenAI — 1,5 milliárd paraméterrel

A modell nyolc kategóriába tartozó érzékeny adatot képes felismerni és eltávolítani, beleértve a neveket, címeket és jelszavakat.

Helyben futó adateltávolító modellt adott ki az OpenAI — 1,5 milliárd paraméterrel
Fotó: Fotó: Kvalifik / Unsplash
forrás: The Decoder·AI Forradalom szerk.·
Megosztás

Nyílt forráskódú AI modellt adott ki az OpenAI, amely automatikusan anonimizálja a szöveges adatokat, mielőtt azokat tovább feldolgoznák. A Privacy Filter nevű eszköz helyben fut, így a személyes adatok sosem hagyják el a felhasználó eszközét — írja a The Decoder.

A Privacy Filter 1,5 milliárd paraméterrel rendelkezik, de kérésenként mindössze 50 millió aktív paramétert használ, így laptopon vagy akár böngészőben is futtatható az OpenAI szerint. A modell nyolc kategóriába sorolja a bizalmas információkat, mint például nevek, címek, e-mail címek, telefonszámok, URL-ek, dátumok, számlaszámok és jelszavak.

Az adatvédelem új dimenziója

A hagyományos chatbotokkal ellentétben a Privacy Filter nem generál új szöveget, hanem egyetlen átfutással jelöli meg és távolítja el a releváns részeket. Az OpenAI szerint a 128 000 tokenes kontextusablak lehetővé teszi hosszú dokumentumok feldolgozását felosztás nélkül.

A modell szabályozhatósága

A felhasználók szabályozhatják az anonimizálás érzékenységét, és a modell finomhangolható saját adathalmazokkal. A Privacy Filter az Apache 2.0 licenc alatt érhető el a GitHubon és a Hugging Face-en, kereskedelmi célra is használható.

Az OpenAI hangsúlyozza, hogy a modell nem garantálja a jogilag megfelelő anonimizálást, és emberi felülvizsgálatot javasol különösen érzékeny esetekben, például az egészségügyben vagy a pénzügyben. A modell teljesítménye csökkenhet nem angol nyelvű vagy nem latin írású szövegek esetén, például 2024. január elsejétől kezdve.

tetszett a cikk? oszd meg →
Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom