안전
워터마킹 (Watermarking)
AI가 생성한 텍스트·이미지·음성에 기계가 읽을 수 있는 숨은 신호를 삽입해 콘텐츠 출처를 증명하는 기술——예를 들어 구글의 SynthID.
워터마킹 (watermarking)은 인공지능이 생성한 콘텐츠에 사람의 눈이나 귀로는 감지할 수 없지만 기계는 읽을 수 있는 숨은 신호를 삽입하는 기술입니다. 목적은 출처(provenance) 표시로, 어떤 텍스트·이미지·음성·영상이 AI로 생성되었는지를 일반적인 편집을 거친 뒤에도 나중에 판별할 수 있게 하는 것입니다.
방식은 콘텐츠 유형에 따라 다릅니다. 텍스트의 경우, 시스템이 생성 과정에서 다음 토큰이 선택될 확률을 미세하게 조정해 탐지기가 인식할 수 있는 통계적 패턴을 만듭니다. 확산 모델로 만든 이미지와 음성·영상의 경우에는 워터마크를 신호 자체에 삽입해 자르기, 압축, 잡음 추가에도 견디도록 합니다. 구글의 SynthID는 이 네 가지 매체 모두를 아우르는 사례입니다.
2025-2026년에 걸쳐 워터마킹은 딥페이크와 허위정보에 대응하는 핵심 도구이자 규제 투명성을 뒷받침하는 수단입니다——EU AI법 제50조는 AI 콘텐츠의 기계 판독 가능한 표시를 요구합니다. 다만 워터마크는 파괴 불가능한 것이 아니어서, 충분히 공격적인 편집이나 의역으로 약화될 수 있습니다.