ArXiv: CIA zeigt, wie die Privatsphäre von Multi-Agenten-Systemen per Black Box gebrochen werden kann
Eine neue Forschungsarbeit zu CIA (Communication Inference Attack) zeigt, dass die Kommunikationstopologie von LLM-Multi-Agenten-Systemen allein durch externe Abfragen mit über 87% Genauigkeit rekonstruiert werden kann. Implikationen für die Sicherheit und Privatsphäre von AI-Systemen.
Dieser Artikel wurde mithilfe von künstlicher Intelligenz aus Primärquellen erstellt.
Ein Forschungsteam hat CIA (Communication Inference Attack) vorgestellt — eine Methode, die es ermöglicht, die interne Kommunikationstopologie von LLM-Multi-Agenten-Systemen ausschließlich über Black-Box-Zugang zu rekonstruieren — ohne Zugriff auf Code, Gewichte oder Logs.
Wie der Angriff funktioniert
CIA sendet sorgfältig gestaltete Anfragen an das Multi-Agenten-System und analysiert die Antworten. Aus den Mustern in den Antworten — Geschwindigkeit, Inhalt, Konsistenz — rekonstruiert der Algorithmus:
- Welche Agenten miteinander kommunizieren
- Die Hierarchie der Entscheidungsfindung
- Den Informationsfluss durch das System
Die Rekonstruktionsgenauigkeit erreicht 0,87+ AUC (Area Under Curve), was bedeutet, dass ein Angreifer die interne Architektur des Systems mit hoher Zuverlässigkeit kartieren kann.
Sicherheitsimplikationen
Die Kenntnis der internen Topologie eines Multi-Agenten-Systems ermöglicht:
- Gezielte Angriffe auf die kritischsten Agenten in der Kette
- Social Engineering — Manipulation spezifischer Agenten, die Einfluss auf Entscheidungen haben
- Intelligenzdiebstahl — Rekonstruktion der Geschäftslogik aus der Systemarchitektur
Warum das wichtig ist
Da Unternehmen zunehmend Multi-Agenten-Systeme für kritische Geschäftsprozesse einsetzen, warnt diese Arbeit, dass die Architektur selbst zur Schwachstelle wird — selbst ohne Zugriff auf Code oder Daten kann ein Angreifer verstehen, wie das System intern funktioniert.
Verwandte Nachrichten
Anthropic: Project Glasswing findet 10.000 hochriskante Schwachstellen im ersten Monat mit Claude Mythos Preview
arXiv:2605.22786: LCGuard schützt geteilten KV-Cache zwischen Agenten in Multi-Agenten-Systemen vor Datenlecks
GitHub: npm 11.15.0 führt Staged Publishing und drei neue Install-Zeit --allow-Flags für Supply-Chain-Hardening ein