OpenAI Privacy Filter란 무엇인가요?

텍스트에서 개인 식별 정보(PII)를 감지하기 위해 특별히 설계된 오픈소스 언어 모델입니다. 128,000 토큰 컨텍스트로 단일 전방 패스에서 8개 PII 카테고리를 텍스트에 태그합니다. Apache 2.0 라이선스로 Hugging Face에서 제공됩니다.

「15억 파라미터, 5000만 활성」은 무엇을 의미하나요?

모델의 총 크기는 15억 파라미터이지만 각 패스에서 활성화되는 것은 5000만 개뿐입니다. 이것은 Mixture-of-Experts(MoE) 아키텍처의 일반적인 패턴으로, 모델이 전체 용량에서는 더 큰 시스템에 해당하지만 추론 비용에서는 훨씬 작은 시스템처럼 작동함을 의미합니다.

어떤 PII 카테고리를 감지하나요?

8개: private_person, private_address, private_email, private_phone, private_url, private_date, account_number, secret. 추가 수정 없이 스페인어, 프랑스어, 중국어, 힌디어 등 여러 언어도 지원합니다.

웹 애플리케이션에 어떻게 통합할 수 있나요?

Hugging Face 블로그는 gradio.Server를 통한 세 가지 데모를 보여줍니다: Document Privacy Explorer(PDF/DOCX), Image Anonymizer(OCR + 픽셀 박스), SmartRedact Paste(자동 편집 기능이 있는 붙여넣기). 모두 동일한 API 패턴 run_privacy_filter(text)를 사용합니다.

OpenAI Privacy Filter 1.5B: Apache 2.0 PII 감지기, 128K 컨텍스트

OpenAI가 Privacy Filter를 발표했습니다——15억 파라미터(5000만 활성), 128,000 토큰 컨텍스트, Apache 2.0 라이선스의 오픈소스 PII 감지기. 단일 전방 패스로 8개 PII 카테고리를 감지하며 PII-Masking-300k 벤치마크에서 SOTA를 달성하고 다국어를 지원합니다.

OpenAI가 Privacy Filter를 발표했습니다——텍스트에서 **개인 식별 정보(PII)**를 감지하기 위해 특별히 설계된 오픈소스 언어 모델입니다. 이 모델은 Apache 2.0 라이선스로 Hugging Face에서 제공되어, 개발자들이 제한 없이 상업 제품에서 자유롭게 사용할 수 있습니다.

기술 사양

Privacy Filter는 신중하게 선택된 여러 특성의 조합으로 주목받습니다:

항목	값
모델 크기	15억 파라미터, 5000만 활성
라이선스	Apache 2.0(관대형)
컨텍스트	128,000 토큰
위치	Hugging Face의 `openai/privacy-filter`

15억 전체와 5000만 활성 파라미터의 차이는 Mixture-of-Experts(MoE) 아키텍처를 시사합니다——모델은 전체 용량에서 더 큰 시스템에 해당하지만 추론 비용에서는 훨씬 작게 작동합니다. 이는 허용 가능한 비용으로 대용량 텍스트를 처리해야 하는 프로덕션 시나리오에 중요합니다.

단일 패스로 8개 PII 카테고리 감지

모델은 다음 8개 카테고리에 텍스트를 태그합니다:

private_person
private_address
private_email
private_phone
private_url
private_date
account_number
secret

핵심 장점: 단일 전방 패스로 최대 128K 토큰의 전체 문서를 커버하여 청킹과 이후 병합이 불필요합니다. 이는 작은 윈도우에서 작동하는 PII 감지기의 일반적인 문제——예를 들어 문서 한 부분에 언급된 이메일이 50,000 토큰 전에 언급된 이름과 관련되어 있음을 인식하는 것——을 방지합니다.

PII-Masking-300k 벤치마크 SOTA

Privacy Filter는 PII-Masking-300k 벤치마크(ai4privacy 데이터셋)에서 최첨단 결과를 달성합니다. Hugging Face 블로그는 또한 모델이 「수정 없이 스페인어, 프랑스어, 중국어, 힌디어 및 기타 언어를 처리한다」고 밝히며 글로벌 애플리케이션에 특히 유용합니다.

웹 애플리케이션 통합을 위한 세 가지 데모

OpenAI의 Hugging Face 블로그는 세 가지 참조 구현을 함께 제공하며, 모두 gradio.Server로 구축되고 동일한 입력 API run_privacy_filter(text)를 사용합니다:

1. Document Privacy Explorer——PDF 및 DOCX 문서 분석. spans 목록({start, end, label})과 PII 발생 통계를 반환합니다.

2. Image Anonymizer——OCR을 사용하여 이미지에서 텍스트를 추출하고, 텍스트에 Privacy Filter를 적용한 후 발견된 span을 픽셀 박스로 매핑하여 시각적으로 가립니다.

3. SmartRedact Paste——자동 편집 기능이 있는 붙여넣기. 원본 텍스트는 reveal 토큰으로만 접근 가능하며, 공개 버전은 플레이스홀더 태그(<CATEGORY>)를 표시합니다.

세 가지 데모는 모두 Hugging Face의 Spaces로 제공되어 자체 구현을 위해 복제할 수 있습니다.

깔끔한 경계를 위한 BIOES 디코딩

Hugging Face 블로그는 Privacy Filter가 깔끔한 span 경계를 유지하기 위해 BIOES 디코딩(Begin, Inside, Outside, End, Single)을 사용한다고 강조합니다. 부정확한 span 끝——예를 들어 전화번호가 다음 문장으로 「넘쳐흐르는」——은 오탐 또는 누락된 PII를 유발할 수 있으므로 이는 실제로 중요합니다.

실천적 시사점

Apache 2.0 라이선스를 가진 이 품질의 오픈소스 PII 감지기는 다양한 시나리오의 컴플라이언스 비용을 변화시킬 가능성이 있습니다:

PII가 특정 처리 경계를 넘지 않았음을 증명해야 하는 GDPR / DPIA 프로세스;
로그 및 분석 파이프라인을 위한 엔터프라이즈 전처리기;
외부 모델에 API 호출을 보내기 전에 입력 문서를 필터링해야 하는 챗봇 및 RAG 시스템;
게시 전 사진 및 문서를 편집하는 미디어 제작.

Apache 2.0은 수정 사항을 공유하거나 사용을 보고할 의무가 없음을 의미합니다——이는 제한적인 라이선스 하의 일부 대안 PII 도구 대비 중요한 장점입니다.

모델은 즉시 사용 가능하며 세 가지 참조 예제는 자체 구현의 템플릿으로 사용할 수 있습니다. 프로덕션 사용을 위해서는 특정 도메인 데이터에 대한 자체 평가가 여전히 권장됩니다——일반적인 벤치마크는 좋은 신호이지만 실제 트래픽 테스트를 대체할 수 없습니다.

OpenAI Privacy Filter 발표: 15억 파라미터, Apache 2.0, 128K 컨텍스트, 단일 스캔으로 8개 PII 카테고리 감지하여 SOTA 달성