OpenAI objavio Privacy Filter: open-weight model za detekciju i redakciju osobnih podataka
Zašto je bitno
OpenAI je objavio open-weight model za detekciju i redakciju osobnih identifikacijskih podataka (PII) u tekstu sa state-of-the-art preciznošću. Model je rijedak OpenAI open-weight release i organizacije ga mogu koristiti lokalno za zaštitu osjetljivih podataka bez slanja u cloud.
OpenAI je objavio Privacy Filter, open-weight model posvećen detekciji i redakciji osobnih identifikacijskih podataka (PII) u tekstu. Prema najavi, model postiže vrhunsku preciznost u ovom specifičnom zadatku, a činjenica da je open-weight znači da ga organizacije mogu preuzeti i pokretati lokalno bez ovisnosti o OpenAI-jevom API-ju.
Objava je primjetna iz dva razloga. Prvo, PII redakcija je kritična funkcija za sve koji rade s osjetljivim podacima. Drugo, OpenAI je povijesno closed-source tvrtka pa je svaki open-weight release događaj vrijedan pažnje.
Što model točno radi?
Privacy Filter je treniran da prepozna tipične kategorije osobnih podataka u slobodnom tekstu — imena, adrese, brojeve telefona, brojeve kartica, OIB ili slične identifikatore, medicinske podatke i druge kategorije koje regulative poput GDPR-a tretiraju kao osobne. Nakon detekcije, model može podatke maskirati ili zamijeniti oznakama, čime se tekst priprema za daljnju obradu bez izlaganja pojedinaca.
Ovakvi alati postoje već godinama (primjerice Microsoft Presidio), ali OpenAI tvrdi da njihov model postiže state-of-the-art rezultate — dakle bolje od postojećih rješenja u istom zadatku.
Zašto je open-weight ključno?
Open-weight znači da su težine modela javno dostupne za preuzimanje i korištenje, najčešće pod licencom koja dopušta komercijalnu uporabu. To nije isto što i open-source (gdje bi bili dostupni i trening podaci i kod), ali je dovoljno da organizacije mogu model pokrenuti na vlastitoj infrastrukturi.
Za tvrtke koje rade s osjetljivim podacima ovo je ogromna razlika u odnosu na API-based rješenja. Slanje medicinskih zapisa, ugovora ili dokumenata s PII podacima OpenAI API-ju nije prihvatljivo u mnogim industrijama, čak i uz poslovne ugovore o obradi podataka. Lokalno pokretanje uklanja taj problem.
Što ovo znači za OpenAI strategiju?
OpenAI je godinama dosljedno closed-source — GPT modeli nikad nisu objavljeni kao open-weight, a konkurencija poput Mete (Llama) i Mistrala je preuzela dio tržišta baš na tom temelju. Objava Privacy Filtera kao open-weight modela može biti taktički potez za specifičnu nišu, a ne znak šireg zaokreta.
Ipak, PII detekcija je zahvalan prvi korak. Model ne zadire u osnovni chat poslovni model OpenAI-ja, a istovremeno pokazuje goodwill prema razvojnoj zajednici i regulatorima koji traže lokalna rješenja. Za krajnje korisnike to je dobra vijest bez obzira na strateške motive — dobili su alat koji mogu koristiti besplatno i lokalno.
Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.