AWS: Novi Bedrock InvokeGuardrailChecks API donosi sigurnosne provjere bez resursa za agentske aplikacije
AWS je u Amazon Bedrocku uveo InvokeGuardrailChecks, API za otkrivanje koji vraća ocjene bez automatskog blokiranja i bez potrebe za unaprijed kreiranim guardrail resursom. Pokriva tri zaštite: filtre sadržaja, detekciju prompt napada (jailbreak, injekcija, curenje) i prepoznavanje osobnih podataka s 31 tipom entiteta. API vraća ocjene ozbiljnosti i pouzdanosti na skali 0 do 1,0, namijenjen višekoračnim agentskim petljama gdje razvojni tim sam kontrolira pragove.
Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.
AWS je u Amazon Bedrocku uveo InvokeGuardrailChecks, API koji agentskim aplikacijama omogućuje sigurnosne provjere bez upravljanja zasebnim resursima.
Po čemu je novi API drugačiji?
InvokeGuardrailChecks je detect-only API: vraća ocjene rizika, ali ne blokira automatski — razvojni tim sam odlučuje što učiniti s rezultatom. Uz to, ne zahtijeva unaprijed kreiran guardrail resurs, pa nema operativnog tereta upravljanja više verzioniranih zaštita. Guardrail je sloj koji provjerava ulaze i izlaze modela radi sigurnosti i usklađenosti.
Koje zaštite pokriva?
API pokriva tri vrste provjera: filtre sadržaja (mržnja, nasilje, seksualni sadržaj, uvrede, nedolično ponašanje), detekciju prompt napada (jailbreak, injekcija upita, curenje podataka) i prepoznavanje osobnih podataka (PII) s 31 tipom entiteta. Vraća ocjene ozbiljnosti i pouzdanosti na skali 0 do 1,0, a za PII i znakovne pozicije u tekstu.
Zašto je to važno za agentske sustave?
Agentske aplikacije rade u više koraka, pa sigurnost treba provjeravati u svakoj iteraciji petlje. Jer API vraća ocjene umjesto tvrdog blokiranja, razvojni tim može postaviti vlastite pragove po koraku — strože ondje gdje agent poziva osjetljive alate, blaže drugdje. Time se sigurnost ugrađuje granularno, bez režije višestrukih guardrail resursa.
Česta pitanja
- Što radi InvokeGuardrailChecks API?
- Detektira rizike i vraća ocjene bez automatskog blokiranja te ne traži unaprijed kreiran guardrail resurs.
- Koje zaštite pokriva?
- Filtre sadržaja, detekciju prompt napada (jailbreak, injekcija, curenje) i prepoznavanje osobnih podataka s 31 tipom entiteta.