🟡 🛡️ Sicherheit Veröffentlicht: · 1 Min. Lesezeit ·

AWS: Neues Bedrock InvokeGuardrailChecks API bringt Sicherheitsprüfungen ohne Ressourcen für agentische Anwendungen

Redaktionelle Illustration: Sicherheitsprüfungen in agentischen KI-Anwendungen

AWS führte InvokeGuardrailChecks in Amazon Bedrock ein, eine Erkennungs-API, die Bewertungen zurückgibt, ohne automatisch zu blockieren und ohne eine vorab erstellte Guardrail-Ressource zu benötigen. Es deckt drei Schutzmaßnahmen ab: Inhaltsfilter, Erkennung von Prompt-Angriffen (Jailbreak, Injektion, Datenleck) und PII-Erkennung mit 31 Entitätstypen. Die API gibt Schweregrad- und Vertrauensbewertungen auf einer Skala von 0 bis 1,0 zurück, konzipiert für mehrstufige agentische Schleifen, bei denen das Entwicklungsteam die Schwellenwerte kontrolliert.

🤖

Dieser Artikel wurde mithilfe von künstlicher Intelligenz aus Primärquellen erstellt.

AWS führte InvokeGuardrailChecks in Amazon Bedrock ein, eine API, die agentischen Anwendungen Sicherheitsprüfungen ohne Verwaltung separater Ressourcen ermöglicht.

Was unterscheidet die neue API?

InvokeGuardrailChecks ist eine reine Erkennungs-API: Sie gibt Risikobewertungen zurück, blockiert aber nicht automatisch — das Entwicklungsteam entscheidet selbst, was mit dem Ergebnis geschieht. Zudem erfordert sie keine vorab erstellte Guardrail-Ressource, was den operativen Aufwand der Verwaltung mehrerer versionierter Guardrails entfällt. Ein Guardrail ist eine Schicht, die Modelleingaben und -ausgaben auf Sicherheit und Compliance prüft.

Welche Schutzmaßnahmen deckt sie ab?

Die API deckt drei Prüfungsarten ab: Inhaltsfilter (Hass, Gewalt, sexuelle Inhalte, Beleidigungen, Fehlverhalten), Erkennung von Prompt-Angriffen (Jailbreak, Prompt-Injektion, Datenleck) und PII-Erkennung (personenbezogene Daten) mit 31 Entitätstypen. Sie gibt Schweregrad- und Vertrauensbewertungen auf einer Skala von 0 bis 1,0 zurück, und für PII auch Zeichenpositionen im Text.

Warum ist das für agentische Systeme wichtig?

Agentische Anwendungen arbeiten in mehreren Schritten, daher muss die Sicherheit bei jeder Iteration der Schleife geprüft werden. Da die API Bewertungen statt harter Blockierungen zurückgibt, können Entwicklungsteams eigene Schwellenwerte pro Schritt festlegen — strenger, wo der Agent sensible Tools aufruft, lockerer anderswo. So wird Sicherheit granular eingebettet, ohne den Overhead mehrerer Guardrail-Ressourcen.

Häufig gestellte Fragen

Was macht die InvokeGuardrailChecks API?
Sie erkennt Risiken und gibt Bewertungen zurück, ohne automatisch zu blockieren, und erfordert keine vorab erstellte Guardrail-Ressource.
Welche Schutzmaßnahmen deckt sie ab?
Inhaltsfilter, Erkennung von Prompt-Angriffen (Jailbreak, Injektion, Datenleck) und PII-Erkennung mit 31 Entitätstypen.