ArXiv: CIA zeigt, wie die Privatsphäre von Multi-Agenten-Systemen per Black Box gebrochen werden kann

Ein Forschungsteam hat CIA (Communication Inference Attack) vorgestellt — eine Methode, die es ermöglicht, die interne Kommunikationstopologie von LLM-Multi-Agenten-Systemen ausschließlich über Black-Box-Zugang zu rekonstruieren — ohne Zugriff auf Code, Gewichte oder Logs.

Wie der Angriff funktioniert

CIA sendet sorgfältig gestaltete Anfragen an das Multi-Agenten-System und analysiert die Antworten. Aus den Mustern in den Antworten — Geschwindigkeit, Inhalt, Konsistenz — rekonstruiert der Algorithmus:

Welche Agenten miteinander kommunizieren
Die Hierarchie der Entscheidungsfindung
Den Informationsfluss durch das System

Die Rekonstruktionsgenauigkeit erreicht 0,87+ AUC (Area Under Curve), was bedeutet, dass ein Angreifer die interne Architektur des Systems mit hoher Zuverlässigkeit kartieren kann.

Sicherheitsimplikationen

Die Kenntnis der internen Topologie eines Multi-Agenten-Systems ermöglicht:

Gezielte Angriffe auf die kritischsten Agenten in der Kette
Social Engineering — Manipulation spezifischer Agenten, die Einfluss auf Entscheidungen haben
Intelligenzdiebstahl — Rekonstruktion der Geschäftslogik aus der Systemarchitektur

Warum das wichtig ist

Da Unternehmen zunehmend Multi-Agenten-Systeme für kritische Geschäftsprozesse einsetzen, warnt diese Arbeit, dass die Architektur selbst zur Schwachstelle wird — selbst ohne Zugriff auf Code oder Daten kann ein Angreifer verstehen, wie das System intern funktioniert.

ArXiv: CIA zeigt, wie die Privatsphäre von Multi-Agenten-Systemen per Black Box gebrochen werden kann

Wie der Angriff funktioniert

Sicherheitsimplikationen

Warum das wichtig ist

Quellen

Verwandte Nachrichten