arXiv: GraphRAG muss nicht zitierte Entitäten dokumentieren

Why Neighborhoods Matter ist ein neues arXiv-Paper, veröffentlicht am 14. Mai 2026 von Riccardo Terrenzi, Maximilian von Zastrow und Serkan Ayvaz (angenommen für den IJCAI-ECAI 2026 Joint Workshop on GENAIK and NORA). Die Autoren argumentieren, dass agentische GraphRAG-Systeme Citation Faithfulness als Trajectory-Level-Problem behandeln müssen — echte Provenienz umfasst nicht nur zitierte Belege, sondern auch besuchte, aber nicht zitierte Entitäten, die das Modell-Reasoning beeinflussen.

Riccardo Terrenzi, Maximilian von Zastrow und Serkan Ayvaz veröffentlichten am 14. Mai 2026 auf arXiv ein Paper, das die traditionelle Auffassung von Citation Faithfulness in GraphRAG-Systemen herausfordert. Das Paper wurde für den IJCAI-ECAI 2026 Joint Workshop on GENAIK and NORA angenommen (7 Seiten, 2 Abbildungen).

Was behauptet das Paper konkret?

Die Autoren schlagen einen radikalen Neurahmen vor: „Citation Faithfulness als Trajectory-Level-Problem.” Aktuelle GraphRAG-Systeme behandeln Zitierungen als „Source Support” — sie zeigen, welche Entitäten im Knowledge-Graph zur Stützung von Behauptungen in einer Antwort zitiert werden. Das Paper argumentiert, dass dies für echte Provenienz unzureichend ist, weil:

Der Agent während des Graph-Traversals viele Entitäten besucht, die er letztlich nicht zitiert
Diese unzitierten Entitäten dennoch das Modell-Reasoning über das Kontextfenster beeinflussen
Ohne Dokumentation der Trajectory sieht der Nutzer nur die finalen Zitierungen und kann nicht rekonstruieren, wie die Antwort tatsächlich entstanden ist

Die These ist provokant, weil sie eine grundlegende Design-Annahme der meisten RAG-Systeme herausfordert: dass Transparenz bedeutet, zu zeigen, welche Quellen das System verwendet hat.

Was zeigen die Ablation-Experimente?

Das Team führt kontrollierte Ablation-Experimente durch, die drei Varianten isolieren:

Zitierte Belege entfernen — was passiert, wenn die zitierten Entitäten entfernt werden?
Nicht zitierte, aber besuchte Belege entfernen — was passiert, wenn Entitäten entfernt werden, die besucht, aber nicht zitiert wurden?
Entitäten maskieren — was passiert, wenn Entitäten durch Platzhaltermasken ersetzt werden?

Kernbefund: Zitierte Belege sind oft notwendig (ihr Entfernen „verändert Antworten erheblich und reduziert die Genauigkeit”). Aber auch: Genaue Antworten können auch von unzitiertem Traversal-Kontext abhängen. Das bedeutet, es gibt ein Äquivalent eines „Hidden State” in der Traversal-Trajectory, das das Ergebnis beeinflusst, aber nicht in der finalen Zitierungsliste erscheint.

Was bedeutet „Provenienz über die breitere Retrieval-Trajectory”?

Das Paper fordert „Beyond Source Support toward Provenance over the Broader Retrieval Trajectory.” Praktische Implikationen für GraphRAG-Systeme:

Traversal-Logs als erstklassige Objekte — nicht nur finale Zitierungen, sondern die Sequenz aller besuchten Entitäten mit Zeitstempeln
Visited-but-Uncited-Marker — explizite Kennzeichnung von Entitäten, die der Agent besucht, aber als „nicht zitierungswürdig” abgelehnt hat
Influence Weights — Quantifizierung, wie stark jede besuchte Entität die finale Antwort beeinflusst hat

Der Ansatz ist komplexer, aber notwendig für Hochrisikobereiche — Recht, Medizin, Finanzen — wo „wie ich zu der Antwort gelangt bin” rekonstruierbar sein muss.

Stellung im GraphRAG- und Agentic-Safety-Diskurs

Das Paper fügt sich in den Trend der Agentic-Safety-Forschung im Mai 2026 ein: arXiv FATE (12.5., Angriffsvermeidung), History Anchors (13.5., 91–98 % unsichere Verschiebung), Sycophantic Consensus (15.5.), Microsoft AI Delegation (15.5., 19–34 % Degradation), GraphFlow (15.5., formale Verifikation). Das Traversal-Context-Paper fügt eine Provenienz-Dimension hinzu — nicht nur „soll der Agent X tun”, sondern „können wir nachträglich rekonstruieren, wie der Agent zu X gelangt ist.”

Das Workshop-Forum (GENAIK + NORA) signalisiert, dass sich die Knowledge-Graph- und KI-Gemeinschaft ernsthaft mit Fragen befasst, die die Mainstream-LLM-Gemeinschaft oft vernachlässigt. Open-Ended-Chain-of-Thought-Reasoning ist undurchsichtig; Graph-Traversal ist inhärent nachverfolgbar — was GraphRAG-Systemen eine einzigartige Möglichkeit für eine Provenienzgarantie bietet, die reines LLM-RAG nicht liefern kann.

Häufig gestellte Fragen

Was behauptet das Paper konkret über Citation Faithfulness?

Die Autoren argumentieren, dass Citation Faithfulness als Trajectory-Level-Problem und nicht als Source-Support-Problem behandelt werden sollte; konkret besuchen agentische GraphRAG-Systeme während des Traversals Entitäten, die sie letztlich nicht zitieren, aber diese unzitierten Entitäten beeinflussen dennoch das Modell-Reasoning über das Kontextfenster — ohne Dokumentation dieser kontextuellen Traversal-Trajectory kann der Nutzer nicht nachvollziehen, wie die Antwort tatsächlich entstanden ist.

Welche Methodik verwenden sie für die Demonstration?

Das Team führt kontrollierte Ablation-Experimente durch: Sie isolieren, entfernen und maskieren zitierte und nicht zitierte Graph-Entitäten; die Ergebnisse zeigen, dass das Entfernen zitierter Belege Antworten erheblich verändert und die Genauigkeit reduziert, aber auch dass genaue Antworten manchmal von unzitiertem Traversal-Kontext abhängen — das ist empirischer Beweis, dass Quellenangaben allein nicht ausreichen.

arXiv:2605.15109 Traversal Context: Agentisches GraphRAG muss besuchte, aber nicht zitierte Entitäten für echte Provenienz dokumentieren

Was behauptet das Paper konkret?

Was zeigen die Ablation-Experimente?

Was bedeutet „Provenienz über die breitere Retrieval-Trajectory”?

Stellung im GraphRAG- und Agentic-Safety-Diskurs

Häufig gestellte Fragen

Quellen

Verwandte Nachrichten