Was ist AgentCore Memory und wofür wird es genutzt?

AgentCore Memory ist ein vollständig verwalteter AWS-Dienst, der KI-Agenten dauerhaftes Speichern von Informationen über Gespräche hinweg ermöglicht, organisiert in isolierten Namespaces pro Entität.

Wie verbessert Metadaten-Filterung die Abrufgenauigkeit?

Attributfilter (Priorität, Abteilung, Zeitraum) werden vor der Vektorähnlichkeitssuche angewendet, wodurch der Kandidatenpool eingeschränkt wird und semantisch ähnliche, aber irrelevante Ergebnisse das Signal nicht verwässern.

Was garantiert die STRICTLY_CONSISTENT-Metadatenextraktion?

Vom Administrator eingetragene Werte werden ohne LLM-Intervention unverändert weitergegeben — das gewährleistet strikte Isolierung zwischen Abteilungen oder Compliance-Stufen in regulierten Umgebungen.

AWS AgentCore Memory: Metadaten-Filterung hebt Genauigkeit auf 64 %

Amazon Bedrock AgentCore Memory führt attributbasierte Metadaten-Filterung ein, die vor der semantischen Suche angewendet wird. In einem Benchmark mit 151 Fragen stieg die Gesamtgenauigkeit von 40 % auf 64 %, bei kontextabhängigen Abfragen von 16 % auf 69 %.

Amazon Web Services hat eine bedeutende Verbesserung des AgentCore Memory-Dienstes innerhalb der Amazon Bedrock-Plattform veröffentlicht — strukturierte Metadaten-Filterung, die die Abrufpräzision in KI-Agenten dramatisch verbessert.

Warum reicht semantische Suche allein nicht aus?

Bisherige Speichersysteme für KI-Agenten stützten sich ausschließlich auf Vektorähnlichkeitssuche: Der Agent stellte eine Anfrage, das System fand die semantisch ähnlichsten Einträge und gab sie als Kontext zurück. Das Problem entsteht, wenn das Archiv groß und vielfältig ist — semantisch verwandte, aber völlig irrelevante Informationen können das relevante Signal überlagern.

Stellen Sie sich einen Agenten vor, der ein Kundenportfolio verwaltet: Die Frage „Welche Aufgaben haben für Q3 Priorität?” sollte ausschließlich hochpriorisierte Einträge aus dem dritten Quartal liefern, nicht alle Dokumentation, die Prioritäten oder Quartale betrifft. Ohne zusätzlichen Filter kann die semantische Suche diesen Unterschied nicht machen.

AgentCore Memory löst dies durch attributbasierte Pre-Filter — Metadaten, die den Kandidatenpool einschränken, bevor der Vektoralgorithmus überhaupt mit der Ähnlichkeitsberechnung beginnt.

Dreiphasiger Speicher-Lebenszyklus

Das neue System funktioniert in drei klar getrennten Schritten.

Konfiguration ist der erste Schritt: Der Administrator definiert, welche Metadaten-Schlüssel das System indizieren soll und welches Extraktionsschema anzuwenden ist. AgentCore Memory unterstützt die Typen STRING, STRINGLIST, NUMBER und DATETIME, und jede Speicherressource kann bis zu 10 indizierte Schlüssel haben.

Ingestion ist der zweite Schritt: Metadaten werden Speicherereignissen auf zwei Arten zugeordnet. Durch automatische Extraktion schlussfolgert der LLM Werte aus dem Gesprächsinhalt, oder durch direkten API-Import für Massenimporte, bei denen die Werte bereits bekannt sind.

Abruf ist der dritte und entscheidende Schritt: Metadatenfilter werden auf den gesamten Eintragsbestand im Namespace angewendet, der KNN-Algorithmus sucht dann nur innerhalb dieser eingeschränkten Menge nach Ähnlichkeit, und die kombinierten Ergebnisse werden an den Agenten zurückgegeben. Die Reihenfolge ist nicht zufällig — der Pre-Filter reduziert die Kandidatenzahl, die die Vektorsuche berücksichtigen muss, drastisch.

Benchmark: Kontextabhängige Abfragen von 16 % auf 69 %

Die Messungen wurden an einem Satz von 151 Fragen durchgeführt, die verschiedene Abfragetypen abdecken — zeitlich begrenzte Suchen, Filterung nach Priorität und abteilungsinterne Suchen.

Ohne Metadaten-Filterung beträgt die Gesamtgenauigkeit 40 %. Mit aktivierter Filterung steigt sie auf 64 % — eine Steigerung um 24 Prozentpunkte. Den dramatischsten Sprung zeigen kontextabhängige Fragen: Die Genauigkeit stieg von 16 % auf 69 %, was bedeutet, dass Abfragen wie „Welche Vereinbarungen aus der letzten Woche haben die Priorität urgent” praktisch nutzbar wurden.

STRICTLY_CONSISTENT: Schutz vor LLM-Variabilität

Eine besonders wichtige Innovation für regulierte Umgebungen ist der Extraktionstyp STRICTLY_CONSISTENT. Bei der Standardextraktion kann der LLM den Metadatenwert aus dem Kontext ableiten — nützlich für flexible Attribute wie Zusammenfassungen, aber gefährlich für Klassifikatoren, die absolut zuverlässig sein müssen.

STRICTLY_CONSISTENT-Schlüssel übertragen Werte buchstäblich, ohne LLM-Intervention. Einträge mit unterschiedlichen deterministischen Werten werden nie zusammengeführt. Es sind maximal 3 solcher Schlüssel pro Strategie erlaubt. Das Ergebnis ist eine harte Isolierung zwischen beispielsweise verschiedenen Vertraulichkeitsstufen oder Rechtsjurisdiktionen in Multi-Tenant-Umgebungen.

Namespace-Isolierung als Fundament

Die Architektur trennt zwei Isolierungsebenen. Der Namespace (z. B. clients/client-123 oder patients/patient-456) definiert, wem die Daten gehören — das ist die primäre, harte Grenze. Metadaten innerhalb dieses Namespaces definieren was und wann — Geschäftsdimensionen wie Abteilung, Status oder Zeitrahmen.

Diese Hierarchie bedeutet, dass ein Agent selbst innerhalb desselben Kundenraums ausschließlich Einträge abrufen kann, die für das aktuelle Projekt relevant sind, ohne ältere oder irrelevante Interaktionen offenzulegen.

Praktische Anwendungsfälle

AWS nennt mehrere Schlüsselszenarien: Multi-Tenant-SaaS-Plattformen, bei denen verschiedene Abteilungen eine Infrastruktur teilen, aber isolierte Speicheransichten haben müssen; Gesundheitswesen, wo HIPAA-Anforderungen durch Metadaten-Compliance-Filter implementiert werden; Kundensupport mit automatischer Weiterleitung nach Eskalationspriorität; sowie Finanzdienstleistungen mit präziser zeitlicher Filterung nach Quartalen oder Regulierungsfristen.

Das System löst Konflikte mit der Regel LATEST_VALUE (letzter Wert gewinnt) oder benutzerdefinierten Domain-Anweisungen. Das Schema ist additiv — Schlüssel können hinzugefügt, aber nicht entfernt werden — was Abwärtskompatibilität für langfristige Produktions-Deployments gewährleistet.

AWS AgentCore Memory erhält Metadaten-Filterung — Genauigkeit steigt von 40 % auf 64 %

Warum reicht semantische Suche allein nicht aus?

Dreiphasiger Speicher-Lebenszyklus

Benchmark: Kontextabhängige Abfragen von 16 % auf 69 %

STRICTLY_CONSISTENT: Schutz vor LLM-Variabilität

Namespace-Isolierung als Fundament

Praktische Anwendungsfälle

Häufig gestellte Fragen

Quellen

Verwandte Nachrichten