AWS: Bedrock AgentCore pool-model multi-tenancy — dijeljena infra, izolirani tenanti
AWS Bedrock AgentCore donosi pool-model multi-tenancy arhitekturu s trorazinskom izolacijom (Tier → Tenant → User), Cedar politikama za granice alata i Token Vending Machineom za izolaciju memorije — referentni SaaS dizajn za produkcijske AI agente.
Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.
AWS je objavio referentni arhitekturni obrazac za produkcijske SaaS AI agente — pool-model multi-tenancy unutar Amazon Bedrock AgentCore platforme.
Što je multi-tenancy i zašto je kritično za SaaS AI?
Multi-tenancy označava arhitekturu u kojoj više neovisnih korisnika — tenanata — dijeli istu infrastrukturu, no njihovi podaci, dozvole i resursi ostaju strogo izolirani jedni od drugih. Za AI agente u SaaS okruženju ovo je posebno zahtjevno: agent mora znati tko ga poziva, kojim alatima smije pristupiti i koje podatke smije vraćati — i to za svakog tenanta zasebno, u realnom vremenu.
Trorazinska hijerarhija izolacije
AgentCore rješenje uvodi tri jasne razine izolacije: Tier → Tenant → User. Na tier razini razlikuju se dvije klase usluge. Basic tier koristi Mistral 3 8B Instruct model s limitom od 2 zahtjeva u sekundi i maksimalno 50 zahtjeva dnevno. Premium tier nudi OpenAI GPT OSS 120B model s 10 zahtjeva u sekundi i 500 dnevno — pet puta veći kapacitet uz znatno snažniji model.
Mehanizmi koji osiguravaju čvrstu izolaciju
Granice alata po tieru definiraju se Cedar authorization politikama — deklarativnim jezikom koji opisuje što koji tier smije raditi, bez hard-coded logike u aplikacijskom kodu.
Za izolaciju memorije sustav koristi Token Vending Machine (TVM) u kombinaciji s ABAC modelom (Attribute-Based Access Control). TVM izdaje kratkotrajne tokene s ugrađenim atributima tenanta, pa memorijski sloj automatski zna kojim podacima koji tenant smije pristupiti.
Treći ključni element je OpenTelemetry baggage mehanizam koji propagira tenant metapodatke — identifikator tenanta, tier razinu, scope dozvola — kroz cijeli životni ciklus zahtjeva, od ulaznog API poziva do odgovora agenta. Na taj način svaki mikroservis u lancu zna kontekst bez dodatnih poziva bazi.
Referentni primjer: zdravstvena platforma
AWS opisuje healthcare SaaS kao primarni primjer: bolnice (tenanti) dijele iste AI agente za obradu medicinskih podataka, ali Cedar politike garantiraju da pacijentski zapisi jedne ustanove nikada nisu dostupni drugoj, čak i unutar istog poziva agentu.
Ovaj obrazac postavlja produkcijski standard za multi-tenant AI agente — zamjenu za ad-hoc pristup u kojem svaki tenant dobiva vlastitu izolianu instancu i time multiplicira infrastrukturne troškove.
Česta pitanja
- Što je multi-tenancy i zašto je važan za AI agente?
- Multi-tenancy označava arhitekturu u kojoj više neovisnih korisnika (tenanata) dijeli istu infrastrukturu, ali su njihovi podaci i dozvole strogo izolirani — ključno za SaaS platforme koje žele smanjiti troškove bez narušavanja privatnosti.
- Kako AgentCore osigurava izolaciju između tenanata?
- Kombinacijom Cedar authorization politika za granice alata po tieru, Token Vending Machinea s ABAC modelom za izolaciju memorije i OpenTelemetry baggage mehanizma koji propagira tenant metapodatke kroz cijeli životni ciklus zahtjeva.