Separable Expert: 재학습 없는 GDPR 준수 LLM 개인화

Chris Schneider, Philipp Schoenegger, Ben Bariach는 2026년 4월 23일 논문 'Separable Expert Architecture'를 발표하여 개인화 LLM이 직면한 가장 큰 GDPR 문제——전체 모델을 재학습하지 않고 개별 사용자 데이터를 삭제하는 방법——를 해결했습니다. 3계층 아키텍처(정적 기반 모델, 조합 가능한 LoRA 어댑터, 사용자별 프록시 아티팩트)가 언러닝을 결정론적 삭제 작업으로 전환합니다. Phi-3.5-mini와 Llama-3.1-8B에서 평가되었습니다.

Chris Schneider, Philipp Schoenegger, Ben Bariach는 2026년 4월 23일 ArXiv에 완전 제목 “Separable Expert Architecture: Toward Privacy-Preserving LLM Personalization via Composable Adapters and Deletable User Proxies”(arXiv:2604.21571)의 논문을 발표했습니다. 이 연구는 개인화 LLM의 산업적 배포에서 가장 어려운 문제 중 하나를 해결합니다: 재앙적인 재학습 비용 없이 사용자의 잊혀질 권리를 준수하는 방법입니다.

GDPR이 개인화 LLM에게 왜 문제입니까?

GDPR 제17조——삭제권(잊혀질 권리)은 모든 EU 거주자에게 운영자의 시스템에서 개인 데이터를 완전히 삭제할 것을 요구할 권리를 부여합니다. 전통적인 SQL 데이터베이스에서는 이것이 간단합니다: DELETE FROM users WHERE id = X. 그러나 사용자 데이터로 개인화된 LLM——예를 들어 당신의 작문 스타일, 선호도, 과거 대화를 기억하는 어시스턴트——에서 데이터는 다른 사용자와 공유하는 수십억 개의 파라미터에 분산되어 있습니다. 저자들은 이를 다음과 같이 설명합니다: “현재 모델 학습 접근 방식은 사용자 정보를 공유 가중치에 직접 통합하여, 재학습 없이 개별 데이터 제거를 계산적으로 실현 불가능하게 만든다”. 즉, “올바른” 삭제의 유일한 방법은 전체 모델을 재학습하는 것인데——GPT급 모델의 경우 수백만 달러의 비용이 듭니다.

Separable Expert 아키텍처는 어떻게 작동합니까?

제안된 접근 방식은 3계층 분해입니다:

정적 기반 모델 — 모든 사용자가 공유하는 수정되지 않은 Phi-3.5-mini 또는 Llama-3.1-8B
조합 가능한 도메인 전문가 LoRA 어댑터 — 사용자 데이터를 내재화하지 않고 행동(의료 도메인, 법률 도메인, 코드)을 형성하는 저랭크 어댑터. **LoRA(저랭크 적응)**는 완전한 모델 변경 없이 작은 추가 행렬을 통해 모델 행동을 수정하는 파인튜닝 기법입니다.
사용자별 프록시 아티팩트 — 개별 사용자 전용의 작은 격리된 파일로, 삭제가 “결정론적 언러닝”을 구성합니다——사용자 영향을 완전히 제거하는 것과 수학적으로 동등합니다.

실험 결과는 무엇을 보여줍니까?

저자들은 Phi-3.5-mini와 Llama-3.1-8B 모델에서 아키텍처를 평가했습니다. 주요 지표: 프록시 삭제 후 KL 발산(두 분포 간의 차이 측도, nats 단위)은 약 0.21 nats——“기준선 복귀” 동작을 확인합니다. **검증 통과율은 82-89%**이며, 사용자 간 오염은 “거의 제로”입니다. 즉, 한 사용자의 데이터가 다른 사용자의 출력에 유출되지 않습니다——이는 멀티테넌트 SaaS 배포에 매우 중요합니다.

GDPR을 넘어선 보안 시사점

삭제권 외에도, 아키텍처는 구조적으로 세 가지 고전적인 LLM 공격을 완화합니다:

모델 역전 — 모델 가중치에서 학습 데이터를 재구성하려는 시도
멤버십 추론 — 특정 레코드가 학습 세트에 있었는지 확인
학습 데이터 추출 — 모델 응답에서 문자 그대로의 데이터를 직접 추출

또한, 아키텍처는 공식적인 프라이버시 보장을 제공하는 **DP-SGD(차분 프라이버시 확률적 경사 하강법)**와 호환되어 공유 컴포넌트를 개선할 수 있습니다.

EU AI Act 준수에 무엇을 의미합니까?

2026년 전면 시행 단계에 있는 EU AI Act는 고위험 시스템에 매우 높은 기준을 설정하고 있습니다——개인 데이터에 대한 사용자 제어의 의무적 메커니즘을 포함합니다. Separable Expert 같은 기술적 솔루션 없이 EU에서 개인화 LLM 서비스를 제공하는 기업은 심각한 규제 위험에 노출됩니다. 이 논문은 경제적으로 파괴적인 재학습 없이 준수하기 위한 프로덕션 경로를 제공합니다——차세대 엔터프라이즈 AI 제품의 참조 아키텍처가 될 수 있습니다.

자주 묻는 질문

GDPR 잊혀질 권리가 LLM에게 문제인 이유는 무엇입니까?

GDPR 제17조(삭제권)는 EU 거주자에게 운영자 시스템에서 개인 데이터를 완전히 삭제하도록 요구할 권리를 부여합니다. 사용자 데이터로 개인화된 LLM의 경우, 데이터가 다른 사용자와 공유하는 가중치에 내재화되어 있어 전체 모델을 재학습하지 않고는 기술적으로 삭제가 거의 불가능하며, 재학습은 재정적·운영적으로 실현 불가능합니다.

Separable Expert는 어떻게 문제를 해결합니까?

3계층 아키텍처가 데이터와 공유 가중치를 분리합니다. 정적 기반 모델은 고정 상태로 유지되고, 조합 가능한 LoRA 어댑터는 사용자 데이터를 내재화하지 않고 도메인 행동을 제공하며, 사용자별 프록시 아티팩트가 개인화를 격리하여 보유합니다. 특정 사용자의 프록시 삭제는 결정론적 삭제로, 수학적으로 언러닝과 동등합니다.

EU AI Act 준수에 대한 상업적 의미는 무엇입니까?

EU AI Act와 GDPR은 삭제권을 점점 더 강력하게 집행하고 있습니다. Separable Expert 같은 기술 아키텍처 없이 개인화 LLM을 배포하는 기업은 규제 제재와 소송 위험에 노출됩니다. 이 논문은 비용이 많이 드는 재학습 없이 준수할 수 있는 프로덕션 경로를 제공합니다.

arXiv:2604.21571 'Separable Expert': 재학습 없이 GDPR 잊혀질 권리를 구현하는 LLM 개인화 아키텍처