OpenAI objavio Privacy Filter: open-weight model za detekciju i redakciju osobnih podataka
OpenAI je objavio open-weight model za detekciju i redakciju osobnih identifikacijskih podataka (PII) u tekstu sa state-of-the-art preciznošću. Model je rijedak OpenAI open-weight release i organizacije ga mogu koristiti lokalno za zaštitu osjetljivih podataka bez slanja u cloud.
Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.
OpenAI je objavio Privacy Filter, open-weight model posvećen detekciji i redakciji osobnih identifikacijskih podataka (PII) u tekstu. Prema najavi, model postiže vrhunsku preciznost u ovom specifičnom zadatku, a činjenica da je open-weight znači da ga organizacije mogu preuzeti i pokretati lokalno bez ovisnosti o OpenAI-jevom API-ju.
Objava je primjetna iz dva razloga. Prvo, PII redakcija je kritična funkcija za sve koji rade s osjetljivim podacima. Drugo, OpenAI je povijesno closed-source tvrtka pa je svaki open-weight release događaj vrijedan pažnje.
Što model točno radi?
Privacy Filter je treniran da prepozna tipične kategorije osobnih podataka u slobodnom tekstu — imena, adrese, brojeve telefona, brojeve kartica, OIB ili slične identifikatore, medicinske podatke i druge kategorije koje regulative poput GDPR-a tretiraju kao osobne. Nakon detekcije, model može podatke maskirati ili zamijeniti oznakama, čime se tekst priprema za daljnju obradu bez izlaganja pojedinaca.
Ovakvi alati postoje već godinama (primjerice Microsoft Presidio), ali OpenAI tvrdi da njihov model postiže state-of-the-art rezultate — dakle bolje od postojećih rješenja u istom zadatku.
Zašto je open-weight ključno?
Open-weight znači da su težine modela javno dostupne za preuzimanje i korištenje, najčešće pod licencom koja dopušta komercijalnu uporabu. To nije isto što i open-source (gdje bi bili dostupni i trening podaci i kod), ali je dovoljno da organizacije mogu model pokrenuti na vlastitoj infrastrukturi.
Za tvrtke koje rade s osjetljivim podacima ovo je ogromna razlika u odnosu na API-based rješenja. Slanje medicinskih zapisa, ugovora ili dokumenata s PII podacima OpenAI API-ju nije prihvatljivo u mnogim industrijama, čak i uz poslovne ugovore o obradi podataka. Lokalno pokretanje uklanja taj problem.
Što ovo znači za OpenAI strategiju?
OpenAI je godinama dosljedno closed-source — GPT modeli nikad nisu objavljeni kao open-weight, a konkurencija poput Mete (Llama) i Mistrala je preuzela dio tržišta baš na tom temelju. Objava Privacy Filtera kao open-weight modela može biti taktički potez za specifičnu nišu, a ne znak šireg zaokreta.
Ipak, PII detekcija je zahvalan prvi korak. Model ne zadire u osnovni chat poslovni model OpenAI-ja, a istovremeno pokazuje goodwill prema razvojnoj zajednici i regulatorima koji traže lokalna rješenja. Za krajnje korisnike to je dobra vijest bez obzira na strateške motive — dobili su alat koji mogu koristiti besplatno i lokalno.
Česta pitanja
- Što je OpenAI Privacy Filter?
- To je open-weight model treniran za detekciju i redakciju osobnih identifikacijskih podataka (PII) u tekstu s vrhunskom preciznošću.
- Zašto je bitno što je open-weight?
- Organizacije mogu model pokrenuti lokalno, bez slanja osjetljivih podataka OpenAI-ju ili drugim cloud servisima.
- Koristi li OpenAI često open-weight release?
- Ne, OpenAI je uglavnom closed-source, pa je ovo rijedak release koji može označiti promjenu smjera za specifične sigurnosne alate.
Povezane vijesti
Anthropic: Project Glasswing pronašao 10.000 visokorizičnih ranjivosti u prvom mjesecu rada s Claude Mythos Preview
arXiv:2605.22786: LCGuard štiti dijeljeni KV cache između agenata u multi-agent sustavima od curenja podataka
GitHub: npm 11.15.0 uvodi staged publishing i tri nova install-time --allow flaga za supply chain hardening