Što je GDPR pravo na zaborav i zašto je problem za LLM-ove?

GDPR Article 17 (Right to Erasure) daje korisnicima EU pravo zahtijevati brisanje svojih osobnih podataka. Kod LLM-ova koji su personalizirani na korisničkim podacima, podaci su utkani u dijeljene weight-ove modela — tehnički ih je gotovo nemoguće obrisati bez ponovnog treniranja cijelog modela, što je financijski i operativno neisplativo.

Kako Separable Expert riješava problem?

Trolayer arhitektura dekupliuje podatke od dijeljenih weightova. Statična baza modela ostaje fiksna, composable LoRA adapteri donose domensko ponašanje bez korisničkih podataka, a per-user proxy artefakti drže personalizaciju izolirano. Brisanje proxyja jednog korisnika je deterministički delete koji je matematički ekvivalentan unlearningu.

Koje su komercijalne implikacije za EU AI Act?

EU AI Act i GDPR sve agresivnije forsiraju Right to Erasure. Bez tehničke arhitekture poput Separable Expert, kompanije koje deploy-aju personalizirane LLM-ove izlažu se riziku regulatornih kazni i sudskih sporova. Rad pruža produkcijski put za compliance bez retreniranja.

Separable Expert: GDPR-compliant LLM personalizacija bez retreniranja

Chris Schneider, Philipp Schoenegger i Ben Bariach objavili su 23. travnja 2026. na ArXivu paper pod punim naslovom “Separable Expert Architecture: Toward Privacy-Preserving LLM Personalization via Composable Adapters and Deletable User Proxies” (arXiv:2604.21571). Rad rješava jedan od najtežih problema u industrijskom deploymentu personaliziranih LLM-ova: kako poštovati pravo korisnika na zaborav bez katastrofalnog troška retreniranja modela.

GDPR Article 17 — Right to Erasure (Pravo na zaborav) daje svakom EU rezidentu pravo zahtijevati potpuno brisanje svojih osobnih podataka iz sustava operatora. Kod tradicionalnih SQL baza ovo je trivijalno: DELETE FROM users WHERE id = X. Ali kod LLM-ova koji su personalizirani na korisničkim podacima — npr. asistent koji pamti vaš stil pisanja, preferencije, prošle razgovore — podaci su distribuirani kroz milijarde parametara dijeljenih s drugim korisnicima. Autori to opisuju ovako: “Current model training approaches incorporate user information directly into shared weights, making individual data removal computationally infeasible without retraining”. Drugim riječima, jedini “ispravan” način brisanja je retreniranje cijelog modela — što za GPT-class modele košta milijune dolara.

Kako radi Separable Expert arhitektura?

Predloženi pristup je trolayer dekompozicija:

Statična baza modela — npr. Phi-3.5-mini ili Llama-3.1-8B u nemodificiranom stanju, dijeljena svim korisnicima
Composable domain-expert LoRA adapteri — niskog ranga adapteri koji oblikuju ponašanje (medicinski domain, legal domain, kod) bez ugrađivanja korisničkih podataka. LoRA (Low-Rank Adaptation) je tehnika fine-tuninga koja modificira ponašanje modela kroz male dodatne matrice umjesto izmjene punog modela.
Per-user proxy artefakti — male, izolirane datoteke specifične za pojedinog korisnika čije brisanje “constitutes deterministic unlearning” — matematički ekvivalentno potpunom uklanjanju utjecaja korisnika.

Što pokazuju eksperimentalni rezultati?

Autori evaluiraju arhitekturu na Phi-3.5-mini i Llama-3.1-8B modelima. Ključne metrike: nakon brisanja proxyja KL divergence (mjera razlike između dvije distribucije, izražena u nats) iznosi približno 0.21 nats — što potvrđuje “return to baseline” ponašanje. Verifikacijska prolaznost je 82-89%, a kontaminacija između korisnika je “near-zero”. Drugim riječima, podaci jednog korisnika ne curiju u izlaze drugih korisnika — što je ključno za multi-tenant SaaS deployment.

Pored Right to Erasure, arhitektura “by construction” mitigira tri klasična napada na LLM-ove:

Model inversion — pokušaj rekonstrukcije trening podataka iz weights modela
Membership inference — utvrđivanje je li određeni record bio u trening setu
Training data extraction — direktno izvlačenje doslovnih podataka iz odgovora modela

Dodatno, arhitektura je kompatibilna s DP-SGD (Differentially Private Stochastic Gradient Descent) za poboljšanje dijeljenih komponenti uz formalne privatnosne garancije.

Što ovo znači za EU AI Act compliance?

EU AI Act, koji je u punoj implementacijskoj fazi tijekom 2026., postavlja vrlo visoke standarde za sustave visokog rizika — uključujući obvezne mehanizme za korisničku kontrolu nad osobnim podacima. Bez tehničkih rješenja poput Separable Expert, kompanije koje pružaju personalizirane LLM usluge u EU izlažu se ozbiljnom regulatornom riziku. Ovaj rad pruža produkcijski put za compliance bez ekonomski razornog retreniranja — i mogao bi postati referentna arhitektura za sljedeću generaciju enterprise AI proizvoda.

arXiv:2604.21571 'Separable Expert': arhitektura za LLM personalizaciju koja omogućuje GDPR pravo na zaborav bez retreniranja

Kako radi Separable Expert arhitektura?

Što pokazuju eksperimentalni rezultati?

Što ovo znači za EU AI Act compliance?

Izvori

Povezane vijesti

Zašto je GDPR problem za personalizirane LLM-ove?

Kako radi Separable Expert arhitektura?

Što pokazuju eksperimentalni rezultati?

Sigurnosne implikacije izvan GDPR-a

Što ovo znači za EU AI Act compliance?

Izvori

Povezane vijesti