🟡 🤝 Agenti Objavljeno: · 2 min čitanja ·

AWS objavio arhitekturu za memoriju AI agenata na razini cijele tvrtke kroz Bedrock, Neptune i Mem0

Editorial illustration: AI agent — agenti

AWS je objavio arhitekturu koja kombinira Amazon Bedrock, Neptune grafovsku bazu i Mem0 framework za persistentnu memoriju AI agenata na razini cijele tvrtke, rješavajući problem gubitka konteksta između sesija i korisnika.

🤖

Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.

Fundamentalni problem agenata

Današnji AI agenti imaju zajednički nedostatak: gube kontekst između interakcija. Nakon završetka sesije agent zaboravlja što je korisnik rekao, koje projekte vodi i koje odluke su već donesene. U enterprise okruženju to je neprihvatljivo jer zahtijeva konstantno ponavljanje konteksta.

AWS je objavio referentnu arhitekturu koja rješava taj problem kombiniranjem tri komponente. Amazon Bedrock pruža temeljne jezične modele (Claude, Llama, Titan), Amazon Neptune služi kao grafovska baza za dugoročnu memoriju, a Mem0 framework upravlja životnim ciklusom memorije — što zapamtiti, kada dohvatiti i kada zaboraviti.

Zašto grafovska baza, a ne vektorska

Većina postojećih rješenja za AI memoriju koristi vektorske baze (Pinecone, Weaviate) koje spremaju embeddinge teksta. Taj pristup dobro radi za semantičko pretraživanje — “nađi slične razgovore” — ali loše za strukturirane odnose.

Amazon Neptune donosi drugačiji pristup. Entiteti (zaposlenici, projekti, dokumenti, klijenti) spremaju se kao čvorovi, a odnosi između njih kao bridovi. Agent može postavljati upite poput “koji dokumenti su povezani s projektom Alfa koji vodi Ana” i dobiti precizan odgovor bez halucinacija. To je ključno za enterprise gdje se traži pouzdanost.

Uloga Mem0 frameworka

Mem0 je open-source framework koji standardizira način na koji agenti upravljaju memorijom. Pruža API-je za tri osnovne operacije: zapisivanje novih činjenica, dohvaćanje relevantnih informacija u kontekstu i zaboravljanje zastarjelih podataka. Bez Mem0, svaki tim mora sam pisati takvu logiku.

AWS arhitektura pokazuje kako Mem0 radi s Bedrock modelima i Neptune bazom. Kada agent primi upit, Mem0 prvo dohvaća relevantnu memoriju iz Neptune grafa, zatim ju ubacuje u prompt za Bedrock model. Nakon odgovora, nove činjenice se spremaju natrag u Neptune kao novi čvorovi i bridovi.

Human-in-the-loop validacija

Ključan element arhitekture je human-in-the-loop validacija. Agent ne sprema automatski sve što nauči — ljudi pregledavaju i odobravaju važne činjenice prije nego što postanu dio trajne memorije. Time se sprječava kontaminacija memorije lošim ili pogrešnim informacijama.

Ovaj pristup posebno je koristan u reguliranim industrijama poput financija i zdravstva, gdje je revidljivost obavezna. Svaka činjenica u memoriji ima metapodatke o tome tko ju je validirao i kada, što olakšava kasnije audite.

Što to znači za enterprise

Kombinacija Bedrock + Neptune + Mem0 omogućuje izgradnju agenata koji pamte kontekst tjednima i mjesecima. To je preduvjet za stvarne produkcijske case-ove poput automatizacije customer service-a, procesnih agenata u operacijama i specijaliziranih agenata za pravne i financijske timove.

Česta pitanja

Zašto AI agentima treba persistentna memorija?
Bez memorije agenti zaboravljaju kontekst čim sesija završi. To znači da svaki put iznova moraju naučiti preference korisnika, povijest projekata i odnose među entitetima. Persistentna memorija omogućuje agentu da se sjeti što je radio prošli tjedan, koji zaposlenik vodi koji projekt i koje su odluke već donesene.
Što donosi Amazon Neptune u ovoj arhitekturi?
Neptune je grafovska baza podataka koja omogućuje složene upite o povezanim entitetima. Primjerice, agent može upitati 'koji zaposlenici su radili na projektima koje je vodio Ivan' — takav upit u relacijskoj bazi zahtijeva više JOIN operacija, dok je u grafu prirodan i brz. Grafovska struktura odgovara kako ljudi pamte odnose.
Koja je uloga Mem0 frameworka?
Mem0 je open-source framework specijaliziran za upravljanje memorijom AI agenata. Apstrahira zapisivanje, dohvaćanje i zaboravljanje informacija, tako da developeri ne moraju ručno pisati logiku za svaku vrstu memorije. Kombinira se s Neptune za dugoročnu pohranu i Bedrock za generiranje odgovora.