AWS AgentCore Memory dobiva filtriranje metapodacima — točnost skočila s 40% na 64%
Amazon Bedrock AgentCore Memory uvodi filtriranje atributnim metapodacima koje se primjenjuje prije semantičke pretrage. Na benchmarku od 151 pitanja ukupna točnost porasla je s 40% na 64%, a za kontekstno-ovisne upite s 16% na 69%.
Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.
Amazon Web Services objavio je značajno unapređenje servisa AgentCore Memory unutar platforme Amazon Bedrock — strukturirano filtriranje metapodacima koje dramatično poboljšava preciznost dohvata informacija u AI agentima.
Zašto samo semantička pretraga nije dovoljna?
Dosadašnji sustavi memorije za AI agente oslanjali su se isključivo na vektorsku pretragu sličnosti: agent bi postavio upit, sustav bi pronašao semantički najsličnije zapise i vratio ih kao kontekst. Problem nastaje kada je arhiva velika i raznolika — semantički srodne, ali potpuno nebitne informacije mogu nadjačati relevantan signal.
Zamislite agenta koji upravlja klijentskim portfeljem: pitanje „koji su prioritetni zadaci za Q3?” trebalo bi donijeti isključivo visokoprioritarne stavke iz trećeg kvartala, a ne svu dokumentaciju koja se tiče prioriteta ili kvartala općenito. Bez dodatnog filtera semantička pretraga ne može napraviti tu razliku.
AgentCore Memory rješava to uvođenjem atributnih pre-filtera — metapodataka koji sužavaju skup kandidata prije nego vektorski algoritam uopće počne računati sličnost.
Trofazni životni ciklus memorije
Novi sustav funkcionira u tri jasno odvojena koraka.
Konfiguracija je prvi korak: administrator definira koje metapodatne ključeve sustav treba indeksirati i kakvu shemu ekstrakcije primijeniti. AgentCore Memory podržava tipove STRING, STRINGLIST, NUMBER i DATETIME, a svaki memorijski resurs može imati do 10 indeksiranih ključeva.
Ingestija je drugi korak: metapodaci se pridružuju memorijskim događajima na dva načina. Automatskom ekstrakcijom LLM zaključuje vrijednosti iz sadržaja razgovora, ili izravnim API unosom za masovne uvoze gdje su vrijednosti već poznate.
Dohvat je treći i ključni korak: filtri metapodataka primjenjuju se na cijelom skupu zapisa unutar namespace-a, KNN algoritam zatim traži sličnost samo unutar tog suženog skupa, a kombinirani rezultati vraćaju se agentu. Redoslijed nije slučajan — pre-filter drastično smanjuje broj kandidata koje vektorska pretraga mora razmatrati.
Benchmark: kontekstno-ovisni upiti s 16% na 69%
Mjerenja su provedena na skupu od 151 pitanja koja pokrivaju različite tipove upita — vremenski ograničene pretrage, filtriranje po prioritetu i pretraživanje unutar odjela.
Bez metapodatnog filtriranja ukupna točnost iznosi 40%. S uključenim filtriranjem ona raste na 64% — povećanje od 24 postotna boda. Najdramatičniji skok vidljiv je kod kontekstno-ovisnih pitanja: točnost je porasla s 16% na 69%, što znači da su upiti poput „koji su dogovori iz prošlog tjedna s prioritetom urgent” postali praktično upotrebljivi.
STRICTLY_CONSISTENT: zaštita od LLM-ove varijabilnosti
Posebno važna inovacija za regulirana okruženja je tip ekstrakcije STRICTLY_CONSISTENT. Kod standardne ekstrakcije LLM može inferirati vrijednost metapodatka iz konteksta — što je korisno za fleksibilne atribute poput sažetaka, ali opasno za klasifikatore koji moraju biti apsolutno pouzdani.
STRICTLY_CONSISTENT ključevi propagiraju vrijednosti doslovno, bez LLM-ove intervencije. Zapisi s različitim determinističkim vrijednostima nikad se ne spajaju. Dopuštena su najviše 3 takva ključa po strategiji. Rezultat je tvrda izolacija između, primjerice, različitih razina povjerljivosti ili zakonskih jurisdikcija u multi-tenant okruženjima.
Namespace izolacija kao temelj
Arhitektura razdvaja dvije razine izolacije. Namespace (npr. clients/client-123 ili patients/patient-456) definira tko posjeduje podatke — to je primarna, tvrda granica. Metapodaci unutar tog namespace-a definiraju što i kada — poslovne dimenzije poput odjela, statusa ili vremenskog okvira.
Ova hijerarhija znači da čak i unutar istog klijentskog prostora agent može dohvatiti isključivo zapise relevantne za tekući projekt, bez izlaganja starijih ili nebitnih interakcija.
Praktične primjene
AWS navodi nekoliko ključnih scenarija: multi-tenant SaaS platforme gdje različiti odjeli dijele infrastrukturu ali moraju imati izolirane poglede na memoriju; zdravstvo gdje se HIPAA zahtjevi implementiraju kroz metapodatne filtere usklađenosti; korisnička podrška s automatskim usmjeravanjem prema prioritetu eskalacije; te financijske usluge s preciznim vremenskim filtriranjem po kvartalima ili regulatornim rokovima.
Sustav konflikte razrješuje pravilom LATEST_VALUE (zadnja vrijednost pobjeđuje) ili prilagođenim domenskim uputama. Shema je aditivna — ključevi se mogu dodavati, ali ne i uklanjati — što garantira kompatibilnost unatratraga za dugoročne produkcijske deploymente.
Česta pitanja
- Što je AgentCore Memory i čemu služi?
- AgentCore Memory je AWS-ov potpuno upravljani servis koji AI agentima omogućuje trajno pamćenje informacija kroz razgovore, organizirano u izolirane prostore po entitetima.
- Kako filtriranje metapodacima poboljšava točnost pretraživanja?
- Atributni filtri (prioritet, odjel, vremenski raspon) primjenjuju se prije vektorske pretrage sličnosti, čime se skup kandidata sužava i semantički slični ali nebitni rezultati ne zagađuju signal.
- Što garantira STRICTLY_CONSISTENT ekstrakcija metapodataka?
- Vrijednosti koje administrator unese propagiraju se nepromijenjene bez LLM-ove intervencije, što osigurava strogu izolaciju između odjela ili razina usklađenosti u reguliranim okruženjima.
Povezane vijesti
Claude Code v2.1.198: background agenti sada sami otvaraju PR-ove, stigao /dataviz skill
AWS objavljuje serverless A2A gateway koji zamjenjuje 190 point-to-point veza središnjim registrom
LangChain uvodi RLM agente: rekurzivni modeli postižu 79% bolje rezultate na dugim kontekstima