AWS:新版Bedrock InvokeGuardrailChecks API为智能体应用带来无需资源的安全检查
AWS在Amazon Bedrock中推出了InvokeGuardrailChecks——一个返回评分而不自动拦截且无需预先创建guardrail资源的检测API。涵盖三类保护:内容过滤器、提示攻击检测(越狱、注入、泄露)以及包含31种实体类型的个人信息识别。API以0到1.0的尺度返回严重性和置信度评分,专为多步骤智能体循环设计,由开发团队自行控制阈值。
本文由人工智能基于一手来源生成。
AWS在Amazon Bedrock中推出了InvokeGuardrailChecks,这一API让智能体应用能够在不管理独立资源的情况下进行安全检查。
新API有何不同?
InvokeGuardrailChecks是一个仅检测API:返回风险评分,但不自动拦截——开发团队自行决定如何处理结果。此外,它不需要预先创建guardrail资源,因此没有管理多个版本化防护的运维负担。Guardrail是检查模型输入输出以确保安全合规的层级。
涵盖哪些保护类型?
API涵盖三类检查:内容过滤器(仇恨、暴力、性内容、侮辱、不当行为)、提示攻击检测(越狱、提示注入、数据泄露)以及包含31种实体类型的个人信息(PII)识别。返回0到1.0尺度上的严重性和置信度评分,对于PII还返回文本中的字符位置。
为何这对智能体系统重要?
智能体应用以多步骤运行,因此需要在循环的每次迭代中检查安全性。由于API返回评分而非硬性拦截,开发团队可以按步骤设置自定义阈值——在智能体调用敏感工具时更严格,在其他情况下更宽松。这使安全性能够精细嵌入,而无需多个guardrail资源的额外开销。
常见问题
- InvokeGuardrailChecks API有什么作用?
- 检测风险并返回评分,不自动拦截,也不需要预先创建guardrail资源。
- 涵盖哪些保护类型?
- 内容过滤器、提示攻击检测(越狱、注入、泄露)以及包含31种实体类型的个人信息识别。