AWS:新しいBedrock InvokeGuardrailChecks APIがエージェント型アプリにリソース不要のセキュリティチェックを提供
AWSはAmazon BedrockにInvokeGuardrailChecksを導入しました。これは自動ブロックを行わず、事前に作成したguardrailリソースも不要なスコアを返す検出APIです。コンテンツフィルター、プロンプト攻撃検出(ジェイルブレイク、インジェクション、リーク)、および31種類のエンティティタイプを持つ個人情報認識の3種類の保護をカバーします。APIは0から1.0のスケールで深刻度と信頼度スコアを返し、開発チームが自らしきい値を制御する多段階エージェントループ向けに設計されています。
この記事はAIにより一次情報源から生成されました。
AWSはAmazon BedrockにInvokeGuardrailChecksを導入しました。このAPIはエージェント型アプリケーションが独立したリソースを管理することなくセキュリティチェックを実行できるようにします。
新しいAPIの何が違うのですか?
InvokeGuardrailChecksは検出専用APIです:リスクスコアを返しますが、自動的にブロックしません——開発チームが結果をどう扱うかを自ら決定します。さらに、事前に作成したguardrailリソースを必要としないため、複数のバージョン管理された保護を管理する運用負荷がありません。Guardrailはセキュリティとコンプライアンスのためにモデルの入出力をチェックする層です。
どのような保護をカバーしますか?
APIは3種類のチェックをカバーします:コンテンツフィルター(ヘイト、暴力、性的コンテンツ、侮辱、不適切な行為)、プロンプト攻撃検出(ジェイルブレイク、プロンプトインジェクション、データリーク)、および31種類のエンティティタイプを持つ個人情報(PII)認識です。0から1.0のスケールで深刻度と信頼度スコアを返し、PIIについてはテキスト内の文字位置も返します。
エージェント型システムにとってなぜ重要なのですか?
エージェント型アプリケーションは多段階で動作するため、ループの各イテレーションでセキュリティをチェックする必要があります。APIはハードブロックではなくスコアを返すため、開発チームはステップごとに独自のしきい値を設定できます——エージェントが機密ツールを呼び出す場合はより厳しく、それ以外の場合はより緩やかに。これにより、複数のguardrailリソースのオーバーヘッドなしに、セキュリティを細かく組み込むことができます。
よくある質問
- InvokeGuardrailChecks APIは何をしますか?
- リスクを検出してスコアを返しますが、自動ブロックは行わず、事前に作成したguardrailリソースも必要としません。
- どのような保護をカバーしますか?
- コンテンツフィルター、プロンプト攻撃検出(ジェイルブレイク、インジェクション、リーク)、および31種類のエンティティタイプを持つ個人情報認識です。