🟡 🤝 Agenten Veröffentlicht: · 2 Min. Lesezeit ·

arXiv:2605.12061 SAGE: Self-Evolving Graph-Memory-Engine erreicht 91,6 % Recall@5 auf Natural Questions

arXiv:2605.12061 ↗

Editorial illustration: dynamischer Graph-Speicher mit Knoten und Feedback-Pfeilen.

SAGE ist eine neue selbst-evolvierende Graph-Memory-Engine für LLM-Agenten, veröffentlicht am 12. Mai 2026 auf arXiv von Juntong Wang und Mitarbeitern der Universität. Die Engine nutzt einen Memory-Writer und Memory-Reader (Graph Foundation Model) in einem Feedback-Loop, der sich autonom erweitert und reorganisiert. Zero-Shot-Open-Domain-Retrieval erreicht 82,5/91,6 Recall@2/5 auf Natural Questions, mit Verbesserungen auf LongMemEval- und HaluMem-Halluzinations-Metriken.

🤖

Dieser Artikel wurde mithilfe von künstlicher Intelligenz aus Primärquellen erstellt.

Juntong Wang, Haoyue Zhao, Guanghui Pan, Xiyuan Wang, Yanbo Wang, Qiyan Deng und Muhan Zhang haben am 12. Mai 2026 SAGE veröffentlicht — eine selbst-evolvierende Graph-Memory-Engine, die das Langzeit-Memory-Limit in Language-Agenten und die Dynamik zwischen strukturiertem Retrieval und Agenten-Feedback adressiert.

Warum reicht klassisches GraphRAG nicht aus?

Klassische RAG- und GraphRAG-Systeme behandeln Memory-Graphen als statischen Retrieval-Index — nach dem Aufbau ändert sich der Graph nicht, sodass der Agent keine neuen Verknüpfungen einführen oder Wissen reorganisieren kann. SAGE geht von der Prämisse aus, dass graph-strukturelle Rollen (z. B. ein Knoten als Entität, eine Kante als Relation, eine Nachbarschaft als Kontext) wiederverwendbare Signale sind, die es der KI-Gedächtniskomponente ermöglichen, durch Interaktion zu reifen.

Wie arbeiten Memory-Writer und Memory-Reader zusammen?

SAGE verbindet zwei Komponenten in einem Feedback-Loop. Der Memory-Writer baut inkrementell einen strukturierten Graph-Speicher aus der Interaktionshistorie des Agenten auf — er fügt Knoten, Kanten und strukturelle Annotationen hinzu. Der Memory-Reader nutzt ein Graph Foundation Model für das Retrieval und gibt entscheidend Feedback an den Writer zurück: welche Knoten und Kanten für eine Antwort nützlich waren, wo die Struktur versagte. Der Loop ermöglicht, dass sich der Speicher durch Reader-Writer-Kommunikation autonom weiterentwickelt.

Welche Zahlen liefern die Benchmarks?

Zero-Shot-Open-Domain-Retrieval auf Natural Questions erreicht 82,5 Recall@2 und 91,6 Recall@5. Multi-Hop-QA erzielt den besten Durchschnittsrang nach zwei Runden Self-Evolution — was bestätigt, dass iteratives Feedback die Graph-Qualität verbessert. Langzeit-Memory- und Halluzinations-Metriken verbesserten sich auf LongMemEval- und HaluMem-Benchmarks.

Training und Reader-Writer-Feedback verbesserten mehrere Performanz-Metriken gleichzeitig, weshalb SAGE die Graph-Gedächtniskomponente als Fundament für Long-Horizon-Language-Agenten positioniert — Szenarien, in denen einzelne Interaktionen in ein wachsendes Netz von Vorwissen eingebettet sein müssen.

Häufig gestellte Fragen

Wodurch unterscheidet sich SAGE von klassischen GraphRAG-Systemen?
Klassische RAG- und GraphRAG-Systeme behandeln Memory-Graphen als statischen Retrieval-Index; SAGE behandelt sie als dynamisches Langzeit-Memory-Substrat, das sich durch Self-Evolution erweitert und reorganisiert, wobei strukturelle Rollen im Graphen für bessere Gedächtnisleistung genutzt werden.
Welche konkreten Benchmark-Ergebnisse wurden erzielt?
Zero-Shot-Open-Domain-Retrieval auf Natural Questions erreichte 82,5 Recall@2 und 91,6 Recall@5; Multi-Hop-QA erzielte den besten Durchschnittsrang nach zwei Runden Self-Evolution; Langzeit-Memory- und Halluzinations-Metriken verbesserten sich auf LongMemEval- und HaluMem-Benchmarks.