AWS Bedrock: guardrail provjere bez resursa

AWS je u Amazon Bedrocku uveo InvokeGuardrailChecks, API za otkrivanje koji vraća ocjene bez automatskog blokiranja i bez potrebe za unaprijed kreiranim guardrail resursom. Pokriva tri zaštite: filtre sadržaja, detekciju prompt napada (jailbreak, injekcija, curenje) i prepoznavanje osobnih podataka s 31 tipom entiteta. API vraća ocjene ozbiljnosti i pouzdanosti na skali 0 do 1,0, namijenjen višekoračnim agentskim petljama gdje razvojni tim sam kontrolira pragove.

AWS je u Amazon Bedrocku uveo InvokeGuardrailChecks, API koji agentskim aplikacijama omogućuje sigurnosne provjere bez upravljanja zasebnim resursima.

Po čemu je novi API drugačiji?

InvokeGuardrailChecks je detect-only API: vraća ocjene rizika, ali ne blokira automatski — razvojni tim sam odlučuje što učiniti s rezultatom. Uz to, ne zahtijeva unaprijed kreiran guardrail resurs, pa nema operativnog tereta upravljanja više verzioniranih zaštita. Guardrail je sloj koji provjerava ulaze i izlaze modela radi sigurnosti i usklađenosti.

Koje zaštite pokriva?

API pokriva tri vrste provjera: filtre sadržaja (mržnja, nasilje, seksualni sadržaj, uvrede, nedolično ponašanje), detekciju prompt napada (jailbreak, injekcija upita, curenje podataka) i prepoznavanje osobnih podataka (PII) s 31 tipom entiteta. Vraća ocjene ozbiljnosti i pouzdanosti na skali 0 do 1,0, a za PII i znakovne pozicije u tekstu.

Zašto je to važno za agentske sustave?

Agentske aplikacije rade u više koraka, pa sigurnost treba provjeravati u svakoj iteraciji petlje. Jer API vraća ocjene umjesto tvrdog blokiranja, razvojni tim može postaviti vlastite pragove po koraku — strože ondje gdje agent poziva osjetljive alate, blaže drugdje. Time se sigurnost ugrađuje granularno, bez režije višestrukih guardrail resursa.

Česta pitanja

Što radi InvokeGuardrailChecks API?

Detektira rizike i vraća ocjene bez automatskog blokiranja te ne traži unaprijed kreiran guardrail resurs.

Koje zaštite pokriva?

Filtre sadržaja, detekciju prompt napada (jailbreak, injekcija, curenje) i prepoznavanje osobnih podataka s 31 tipom entiteta.

AWS: Novi Bedrock InvokeGuardrailChecks API donosi sigurnosne provjere bez resursa za agentske aplikacije

Po čemu je novi API drugačiji?

Koje zaštite pokriva?

Zašto je to važno za agentske sustave?

Česta pitanja

Izvori

Povezane vijesti