RaMem: Langzeitgedächtnis für KI-Agenten

RaMem ist ein vierstufiges Framework, das Kontextkollaps in agentischen Gedächtnissystemen verhindert — einen Zustand, in dem komprimierte Fragmente ihren umgebenden Kontext verlieren und fälschlicherweise als gleich relevant dargestellt werden. Auf Langzeitgedächtnis-Benchmarks erzielt es einen durchschnittlichen F1-Gewinn von mehr als 10 % gegenüber bestehenden Basissystemen.

Warum Agenten vergessen — und sich falsch erinnern

Das Langzeitgedächtnis sprachlicher Agenten birgt eine Falle: Wenn ein System vergangene Interaktionen zu kurzen Fragmenten komprimiert, verlieren diese Fragmente ihren ursprünglichen episodischen Kontext — wer am Gespräch beteiligt war, wann es stattfand und in welcher Sitzung. Das Ergebnis ist Kontextkollaps — ein Zustand, in dem das Retrieval-Modul Fragmente aus völlig verschiedenen Situationen als gleich relevant betrachtet und falsche Erinnerungen zurückgibt. Ein Team der USC und verwandter Institutionen schlägt RaMem vor, um dieses Problem systematisch zu lösen.

Vier Schritte zu zuverlässigem Abrufen

RaMem funktioniert als vierstufige Relevanzprüfungskette.

Evidence Anchoring ist der erste Schritt: Jede Erinnerung erhält beim Speichern einen episodischen Anker — Zeit, Teilnehmer und Sitzungskennung werden festgehalten. Ohne diesen Anker kann das Retrieval den Kontext der Speicherung nicht mit dem Kontext der Abfrage vergleichen.

Recall Condition Induction extrahiert die Bedingungen, die eine Abfrage implizit voraussetzt. Fragt der Agent „Was haben wir letzte Woche mit Markus vereinbart?”, leitet das System automatisch die zeitliche und teilnehmerbezogene Dimension als Suchbedingungen ab.

Validity-Aware Retrieval bevorzugt dann Fragmente, deren episodischer Anker den abgeleiteten Bedingungen entspricht — anstatt nur die semantische Ähnlichkeit zu bewerten.

Context-Preserved Synthesis erstellt schließlich die Antwort unter Beibehaltung des strukturierten Kontexts, was einen sekundären Kollaps bei der Generierung verhindert.

Mehr als 10 % F1 über starken Basiswerten

Auf Standard-Langzeitgedächtnis-Benchmarks erzielt RaMem einen durchschnittlichen F1-Gewinn von mehr als 10 % im Vergleich zu bestehenden Gedächtnissystemen. Der entscheidende Vorteil: Das Framework ist modell-agnostisch — es funktioniert mit verschiedenen zugrunde liegenden Sprachmodellen ohne Anpassung der Architektur. Die Arbeit wurde am 22. Juni 2026 auf arXiv eingereicht (cs.AI, cs.MA); Autoren sind Wei Yang, Bryce Kan und Mitarbeiter der University of Southern California.

Häufig gestellte Fragen

Was ist Kontextkollaps, und warum schadet er Agenten?

Kontextkollaps tritt auf, wenn ein Gedächtnissystem Fragmente aus verschiedenen Situationen so komprimiert, dass sie ihren zeitlichen, sitzungsbezogenen und teilnehmerbezogenen Kontext verlieren — das Retrieval kann dann die echte Relevanz nicht einschätzen und gibt falsche Erinnerungen zurück.

Um wie viel verbessert RaMem die Genauigkeit im Vergleich zu bestehenden Systemen?

Auf mehreren Langzeitgedächtnis-Benchmarks erzielt RaMem einen durchschnittlichen F1-Gewinn von mehr als 10 % gegenüber starken Basissystemen — unabhängig vom konkreten zugrunde liegenden Sprachmodell.

arXiv:2606.22844: RaMem löst Kontextkollaps im Langzeitgedächtnis agentischer Systeme

Warum Agenten vergessen — und sich falsch erinnern

Vier Schritte zu zuverlässigem Abrufen

Mehr als 10 % F1 über starken Basiswerten

Häufig gestellte Fragen

Quellen

Verwandte Nachrichten