Sicherheit
Wasserzeichen (KI)
Einbettung verborgener, maschinenlesbarer Signale in KI-generierten Text, Bilder oder Audio zum Nachweis der Herkunft — etwa Googles SynthID.
Wasserzeichen (watermarking) bezeichnet das Einbetten verborgener, maschinenlesbarer Signale — für das menschliche Auge oder Ohr nicht wahrnehmbar — in Inhalte, die von künstlicher Intelligenz erzeugt werden. Ziel ist die Kennzeichnung der Herkunft (provenance): Es soll später feststellbar sein, ob ein Text, ein Bild, eine Audio- oder Videodatei KI-generiert wurde, selbst nach gewöhnlichen Bearbeitungen.
Das Verfahren hängt von der Inhaltsart ab. Bei Text passt das System die Wahrscheinlichkeiten der bei der Generierung gewählten Tokens subtil an und erzeugt so ein statistisches Muster, das ein Detektor erkennt. Bei Bildern aus Diffusionsmodellen sowie bei Audio und Video wird das Wasserzeichen in das Signal selbst eingebettet, sodass es Zuschneiden, Komprimierung oder hinzugefügtes Rauschen übersteht. Googles SynthID ist ein Beispiel für diesen Ansatz über alle vier Medienarten.
In den Jahren 2025-2026 ist das Wasserzeichen ein zentrales Mittel gegen Deepfakes und Desinformation sowie eine Stütze regulatorischer Transparenz — Artikel 50 des EU AI Act verlangt eine maschinenlesbare Kennzeichnung von KI-Inhalten. Wasserzeichen sind jedoch nicht unzerstörbar: Hinreichend aggressive Bearbeitung oder Paraphrasierung kann sie schwächen.