Microsoft Research: LLMs korrumpieren Dokumente durch iterative Delegation — 19–34 % Fidelity-Degradation in 20 Iterationen
Further Notes on AI Delegation and Long-Horizon Reliability ist ein neuer Microsoft-Research-Blogbeitrag, veröffentlicht am 15. Mai 2026 von Philippe Laban, Tobias Schnabel und Jennifer Neville. Es handelt sich um ein Follow-up zum ursprünglichen Paper LLMs Corrupt Your Documents When You Delegate. Die Forschung zeigt eine Fidelity-Degradation von 19–34 % über 20 Delegationsiterationen; das Problem ist systemischer Natur und tritt bei verschiedenen Modellen auf, wobei es sich besonders auf Long-Horizon-Agenten-Workflows auswirkt.
Dieser Artikel wurde mithilfe von künstlicher Intelligenz aus Primärquellen erstellt.
Das Microsoft-Research-Team von Philippe Laban, Tobias Schnabel und Jennifer Neville hat am 15. Mai 2026 den Blogbeitrag „Further Notes on Our Recent Research on AI Delegation and Long-Horizon Reliability” veröffentlicht — ein Follow-up zu ihrem ursprünglichen Paper, das dramatisch auf eine ernsthafte Zuverlässigkeitslücke in modernen Agentensystemen hingewiesen hat.
Was hat das ursprüngliche Paper aufgedeckt?
Die ursprüngliche Arbeit „LLMs Corrupt Your Documents When You Delegate” hat demonstriert, dass iterative Delegation der Dokumentenbearbeitung den Inhalt durch aufeinanderfolgende KI-Iterationen korrumpiert. Das Team hat einen Fidelity-Score gemessen — wie gut Qualität, Genauigkeit und Kohärenz eines Dokuments über Delegationszyklen erhalten bleiben — und festgestellt, dass Modelle systematisch Informationen durch Iterationen verlieren, selbst wenn jede einzelne Iteration vernünftig erscheint.
Welche konkreten Zahlen liefert das Paper?
Über 20 Delegationsiterationen hinweg erreicht die Fidelity-Degradation 19–34 %, abhängig von Aufgabentyp und konkretem Modell. Diese Zahl ist bedeutsam, weil sie das Problem von „das Modell macht manchmal Fehler” in „ein systemisches Degradationssignal, das sich exponentiell akkumuliert” verwandelt. Nach 20 Iterationen ist ein Dokument keine verlässliche Repräsentation des ursprünglichen Inhalts mehr — und das ist genau die Iterationsanzahl, die langlebige Agenten-Workflows typischerweise überschreiten.
Was klärt der Follow-up-Blogbeitrag?
Das Team hat einen Follow-up veröffentlicht, weil das ursprüngliche Paper erhebliche Diskussionen ausgelöst hat und die Autoren „several important points about what the paper does — and does not — claim” klarstellen wollten. Der Blogbeitrag adressiert:
- Allgemeinheit des Problems — gilt dies für ein spezifisches Modell oder eine systemische Problemklasse?
- Mitigationsstrategien — welche Ansätze helfen, die Degradation zu reduzieren?
- Implikationen für Produktionsagenten — welche Workflows sind am stärksten betroffen?
Was bedeutet dieser Befund für Agenten-Workflows?
Long-Horizon-Agenten-Workflows sind am stärksten betroffen. Typische Beispiele: Forschungsagenten, die Entwürfe generieren, bearbeiten und weiterleiten; mehrstufige Dokumentenautomatisierung, bei der ein einzelnes Dokument Dutzende von Transformationen durchläuft; kontinuierliche Zusammenfassungszyklen, bei denen ein Agent ein großes Korpus durch iteratives Zusammenfassen reduziert.
Die Arbeit widerlegt implizit die verbreitete Vorstellung, dass Agenten-Zuverlässigkeit ein Problem ist, das allein durch ein besseres Modell gelöst werden kann — das Degradationsmuster ist systemisch genug, um den Bedarf an architektonischen Lösungen zu signalisieren: Ground-Truth-Retention, periodische Verifizierung anhand des Originals, explizite Revisionsüberprüfung, bevor ein Agent Inhalte weiterleitet.
Dieser Ansatz knüpft an die dramatische Safety/Reliability-Paper-Welle von 2026 an — arXiv:2605.13825 History Anchors (14.5.), arXiv:2605.12474 Reward Hacking Rubric (13.5.), arXiv:2605.11882 FATE Safety (13.5.). Die Microsoft-Research-Arbeit zusammen mit dieser arXiv-Welle signalisiert die Reifung von Agentic Reliability Research als eigenständige Disziplin.
Häufig gestellte Fragen
- Was misst die Forschung konkret?
- Das Team misst die Fidelity-Degradation — wie stark Qualität und Genauigkeit des Inhalts durch aufeinanderfolgende Iterationen der KI-delegierten Dokumentenbearbeitung abnehmen; nach 20 Iterationen erreicht die Degradation 19–34 %, abhängig von Aufgabentyp und Modell.
- Was bedeutet dieser Befund für Agenten-Workflows?
- Long-Horizon-Agenten-Workflows (Forschungsagenten, mehrstufige Dokumentenautomatisierung, kontinuierliche Zusammenfassungszyklen) sind am stärksten betroffen — jede Delegation führt eine kleine Degradation ein, die sich kumulativ aufaddiert und den Output systematisch über die Zeit hinweg korrumpiert.
Verwandte Nachrichten
Anthropic: Project Glasswing findet 10.000 hochriskante Schwachstellen im ersten Monat mit Claude Mythos Preview
arXiv:2605.22786: LCGuard schützt geteilten KV-Cache zwischen Agenten in Multi-Agenten-Systemen vor Datenlecks
GitHub: npm 11.15.0 führt Staged Publishing und drei neue Install-Zeit --allow-Flags für Supply-Chain-Hardening ein