InvokeGuardrailChecks API有什么作用？

检测风险并返回评分，不自动拦截，也不需要预先创建guardrail资源。

AWS Bedrock：无需资源的Guardrail检查

AWS在Amazon Bedrock中推出了InvokeGuardrailChecks——一个返回评分而不自动拦截且无需预先创建guardrail资源的检测API。涵盖三类保护：内容过滤器、提示攻击检测（越狱、注入、泄露）以及包含31种实体类型的个人信息识别。API以0到1.0的尺度返回严重性和置信度评分，专为多步骤智能体循环设计，由开发团队自行控制阈值。

AWS在Amazon Bedrock中推出了InvokeGuardrailChecks，这一API让智能体应用能够在不管理独立资源的情况下进行安全检查。

新API有何不同？

InvokeGuardrailChecks是一个仅检测API：返回风险评分，但不自动拦截——开发团队自行决定如何处理结果。此外，它不需要预先创建guardrail资源，因此没有管理多个版本化防护的运维负担。Guardrail是检查模型输入输出以确保安全合规的层级。

涵盖哪些保护类型？

API涵盖三类检查：内容过滤器（仇恨、暴力、性内容、侮辱、不当行为）、提示攻击检测（越狱、提示注入、数据泄露）以及包含31种实体类型的个人信息（PII）识别。返回0到1.0尺度上的严重性和置信度评分，对于PII还返回文本中的字符位置。

为何这对智能体系统重要？

智能体应用以多步骤运行，因此需要在循环的每次迭代中检查安全性。由于API返回评分而非硬性拦截，开发团队可以按步骤设置自定义阈值——在智能体调用敏感工具时更严格，在其他情况下更宽松。这使安全性能够精细嵌入，而无需多个guardrail资源的额外开销。

AWS：新版Bedrock InvokeGuardrailChecks API为智能体应用带来无需资源的安全检查

新API有何不同？

涵盖哪些保护类型？

为何这对智能体系统重要？

常见问题

来源

相关新闻