AWS AgentCore: pool-model multi-tenancy

AWS Bedrock AgentCore donosi pool-model multi-tenancy arhitekturu s trorazinskom izolacijom (Tier → Tenant → User), Cedar politikama za granice alata i Token Vending Machineom za izolaciju memorije — referentni SaaS dizajn za produkcijske AI agente.

AWS je objavio referentni arhitekturni obrazac za produkcijske SaaS AI agente — pool-model multi-tenancy unutar Amazon Bedrock AgentCore platforme.

Što je multi-tenancy i zašto je kritično za SaaS AI?

Multi-tenancy označava arhitekturu u kojoj više neovisnih korisnika — tenanata — dijeli istu infrastrukturu, no njihovi podaci, dozvole i resursi ostaju strogo izolirani jedni od drugih. Za AI agente u SaaS okruženju ovo je posebno zahtjevno: agent mora znati tko ga poziva, kojim alatima smije pristupiti i koje podatke smije vraćati — i to za svakog tenanta zasebno, u realnom vremenu.

Trorazinska hijerarhija izolacije

AgentCore rješenje uvodi tri jasne razine izolacije: Tier → Tenant → User. Na tier razini razlikuju se dvije klase usluge. Basic tier koristi Mistral 3 8B Instruct model s limitom od 2 zahtjeva u sekundi i maksimalno 50 zahtjeva dnevno. Premium tier nudi OpenAI GPT OSS 120B model s 10 zahtjeva u sekundi i 500 dnevno — pet puta veći kapacitet uz znatno snažniji model.

Mehanizmi koji osiguravaju čvrstu izolaciju

Granice alata po tieru definiraju se Cedar authorization politikama — deklarativnim jezikom koji opisuje što koji tier smije raditi, bez hard-coded logike u aplikacijskom kodu.

Za izolaciju memorije sustav koristi Token Vending Machine (TVM) u kombinaciji s ABAC modelom (Attribute-Based Access Control). TVM izdaje kratkotrajne tokene s ugrađenim atributima tenanta, pa memorijski sloj automatski zna kojim podacima koji tenant smije pristupiti.

Treći ključni element je OpenTelemetry baggage mehanizam koji propagira tenant metapodatke — identifikator tenanta, tier razinu, scope dozvola — kroz cijeli životni ciklus zahtjeva, od ulaznog API poziva do odgovora agenta. Na taj način svaki mikroservis u lancu zna kontekst bez dodatnih poziva bazi.

Referentni primjer: zdravstvena platforma

AWS opisuje healthcare SaaS kao primarni primjer: bolnice (tenanti) dijele iste AI agente za obradu medicinskih podataka, ali Cedar politike garantiraju da pacijentski zapisi jedne ustanove nikada nisu dostupni drugoj, čak i unutar istog poziva agentu.

Ovaj obrazac postavlja produkcijski standard za multi-tenant AI agente — zamjenu za ad-hoc pristup u kojem svaki tenant dobiva vlastitu izolianu instancu i time multiplicira infrastrukturne troškove.

Česta pitanja

Što je multi-tenancy i zašto je važan za AI agente?

Multi-tenancy označava arhitekturu u kojoj više neovisnih korisnika (tenanata) dijeli istu infrastrukturu, ali su njihovi podaci i dozvole strogo izolirani — ključno za SaaS platforme koje žele smanjiti troškove bez narušavanja privatnosti.

Kako AgentCore osigurava izolaciju između tenanata?

Kombinacijom Cedar authorization politika za granice alata po tieru, Token Vending Machinea s ABAC modelom za izolaciju memorije i OpenTelemetry baggage mehanizma koji propagira tenant metapodatke kroz cijeli životni ciklus zahtjeva.

AWS: Bedrock AgentCore pool-model multi-tenancy — dijeljena infra, izolirani tenanti

Što je multi-tenancy i zašto je kritično za SaaS AI?

Trorazinska hijerarhija izolacije

Mehanizmi koji osiguravaju čvrstu izolaciju

Referentni primjer: zdravstvena platforma

Česta pitanja

Izvori

Povezane vijesti