arXiv SAGE: 91,6 % Recall@5 in Graph-Memory-Engine

SAGE ist eine neue selbst-evolvierende Graph-Memory-Engine für LLM-Agenten, veröffentlicht am 12. Mai 2026 auf arXiv von Juntong Wang und Mitarbeitern der Universität. Die Engine nutzt einen Memory-Writer und Memory-Reader (Graph Foundation Model) in einem Feedback-Loop, der sich autonom erweitert und reorganisiert. Zero-Shot-Open-Domain-Retrieval erreicht 82,5/91,6 Recall@2/5 auf Natural Questions, mit Verbesserungen auf LongMemEval- und HaluMem-Halluzinations-Metriken.

Juntong Wang, Haoyue Zhao, Guanghui Pan, Xiyuan Wang, Yanbo Wang, Qiyan Deng und Muhan Zhang haben am 12. Mai 2026 SAGE veröffentlicht — eine selbst-evolvierende Graph-Memory-Engine, die das Langzeit-Memory-Limit in Language-Agenten und die Dynamik zwischen strukturiertem Retrieval und Agenten-Feedback adressiert.

Warum reicht klassisches GraphRAG nicht aus?

Klassische RAG- und GraphRAG-Systeme behandeln Memory-Graphen als statischen Retrieval-Index — nach dem Aufbau ändert sich der Graph nicht, sodass der Agent keine neuen Verknüpfungen einführen oder Wissen reorganisieren kann. SAGE geht von der Prämisse aus, dass graph-strukturelle Rollen (z. B. ein Knoten als Entität, eine Kante als Relation, eine Nachbarschaft als Kontext) wiederverwendbare Signale sind, die es der KI-Gedächtniskomponente ermöglichen, durch Interaktion zu reifen.

Wie arbeiten Memory-Writer und Memory-Reader zusammen?

SAGE verbindet zwei Komponenten in einem Feedback-Loop. Der Memory-Writer baut inkrementell einen strukturierten Graph-Speicher aus der Interaktionshistorie des Agenten auf — er fügt Knoten, Kanten und strukturelle Annotationen hinzu. Der Memory-Reader nutzt ein Graph Foundation Model für das Retrieval und gibt entscheidend Feedback an den Writer zurück: welche Knoten und Kanten für eine Antwort nützlich waren, wo die Struktur versagte. Der Loop ermöglicht, dass sich der Speicher durch Reader-Writer-Kommunikation autonom weiterentwickelt.

Welche Zahlen liefern die Benchmarks?

Zero-Shot-Open-Domain-Retrieval auf Natural Questions erreicht 82,5 Recall@2 und 91,6 Recall@5. Multi-Hop-QA erzielt den besten Durchschnittsrang nach zwei Runden Self-Evolution — was bestätigt, dass iteratives Feedback die Graph-Qualität verbessert. Langzeit-Memory- und Halluzinations-Metriken verbesserten sich auf LongMemEval- und HaluMem-Benchmarks.

Training und Reader-Writer-Feedback verbesserten mehrere Performanz-Metriken gleichzeitig, weshalb SAGE die Graph-Gedächtniskomponente als Fundament für Long-Horizon-Language-Agenten positioniert — Szenarien, in denen einzelne Interaktionen in ein wachsendes Netz von Vorwissen eingebettet sein müssen.

Häufig gestellte Fragen

Wodurch unterscheidet sich SAGE von klassischen GraphRAG-Systemen?

Klassische RAG- und GraphRAG-Systeme behandeln Memory-Graphen als statischen Retrieval-Index; SAGE behandelt sie als dynamisches Langzeit-Memory-Substrat, das sich durch Self-Evolution erweitert und reorganisiert, wobei strukturelle Rollen im Graphen für bessere Gedächtnisleistung genutzt werden.

Welche konkreten Benchmark-Ergebnisse wurden erzielt?

Zero-Shot-Open-Domain-Retrieval auf Natural Questions erreichte 82,5 Recall@2 und 91,6 Recall@5; Multi-Hop-QA erzielte den besten Durchschnittsrang nach zwei Runden Self-Evolution; Langzeit-Memory- und Halluzinations-Metriken verbesserten sich auf LongMemEval- und HaluMem-Benchmarks.

arXiv:2605.12061 SAGE: Self-Evolving Graph-Memory-Engine erreicht 91,6 % Recall@5 auf Natural Questions

Warum reicht klassisches GraphRAG nicht aus?

Wie arbeiten Memory-Writer und Memory-Reader zusammen?

Welche Zahlen liefern die Benchmarks?

Häufig gestellte Fragen

Quellen

Verwandte Nachrichten