🟡 🤝 智能体 发布于: · 3 分钟阅读 ·

AWS AgentCore Memory 引入元数据过滤——准确率从 40% 跃升至 64%

编辑插图:AWS AgentCore 内存命名空间与 AI 智能体的元数据过滤

Amazon Bedrock AgentCore Memory 引入了属性元数据过滤,该过滤在语义搜索之前应用。在 151 个问题的基准测试中,总体准确率从 40% 提升至 64%,上下文相关查询的准确率从 16% 提升至 69%。

🤖

本文由人工智能基于一手来源生成。

Amazon Web Services 发布了 Amazon Bedrock 平台内 AgentCore Memory 服务的重大升级——结构化元数据过滤,大幅提升了 AI 智能体信息检索的精度。

为何仅凭语义搜索还不够?

此前的 AI 智能体记忆系统完全依赖向量相似性搜索:智能体发起查询,系统找到语义上最相似的记录并将其作为上下文返回。当存档庞大且多样时,问题随之而来——语义相关但完全不重要的信息可能会压过相关信号。

试想一个管理客户组合的智能体:「Q3 的优先任务是什么?」这个问题应该只返回第三季度的高优先级事项,而非所有涉及优先级或季度的文档。没有额外的过滤器,语义搜索无法做出这种区分。

AgentCore Memory 通过引入属性预过滤器来解决这一问题——这些元数据在向量算法开始计算相似性之前就缩小了候选集。

三阶段记忆生命周期

新系统以三个明确分离的步骤运作。

配置是第一步:管理员定义系统需要索引哪些元数据键以及应用哪种提取方案。AgentCore Memory 支持 STRINGSTRINGLISTNUMBERDATETIME 类型,每个记忆资源最多可有 10 个索引键

摄入是第二步:元数据通过两种方式附加到记忆事件上。通过自动提取,LLM 从对话内容中推断值;或通过直接 API 输入用于批量导入已知值的场景。

检索是第三步也是关键步骤:元数据过滤器应用于命名空间内的整个记录集,KNN 算法随后仅在该缩小后的集合中搜索相似性,组合结果返回给智能体。顺序并非随机——预过滤大幅减少了向量搜索需要考虑的候选数量。

基准测试:上下文相关查询从 16% 提升至 69%

测试在 151 个问题的集合上进行,涵盖不同类型的查询——时间限制搜索、按优先级过滤和部门内搜索。

不使用元数据过滤时,总体准确率为 40%。启用过滤后,准确率提升至 64%——增加了 24 个百分点。上下文相关问题的提升最为显著:准确率从 16% 跃升至 69%,这意味着「上周与紧急优先级相关的协议是哪些」这类查询变得切实可用。

STRICTLY_CONSISTENT:防止 LLM 变异性的保护措施

对受监管环境而言,特别重要的创新是 STRICTLY_CONSISTENT 提取类型。在标准提取中,LLM 可以从上下文推断元数据值——这对摘要等灵活属性有用,但对必须绝对可靠的分类器而言则存在风险。

STRICTLY_CONSISTENT 键会原样传播值,不经过 LLM 干预。具有不同确定性值的记录永远不会合并。每个策略最多允许 3 个此类键。结果是在多租户环境中不同保密级别或法律管辖区之间实现了硬隔离。

命名空间隔离作为基础

架构分为两个隔离级别。命名空间(例如 clients/client-123patients/patient-456)定义拥有数据——这是主要的、硬性边界。该命名空间内的元数据定义什么和何时——部门、状态或时间框架等业务维度。

这种层次结构意味着即使在同一客户空间内,智能体也只能检索与当前项目相关的记录,而不会暴露旧的或无关的交互。

实际应用

AWS 列举了几个关键场景:不同部门共享基础设施但需要隔离记忆视图的多租户 SaaS 平台;通过元数据合规过滤器实现 HIPAA 要求的医疗保健领域;根据升级优先级自动路由的客户支持;以及按季度或监管截止日期进行精确时间过滤的金融服务

系统通过 LATEST_VALUE 规则(最新值优先)或自定义领域指令来解决冲突。方案是累加式的——可以添加键但不能删除——这保证了长期生产部署的向后兼容性。

常见问题

什么是 AgentCore Memory,它有什么用途?
AgentCore Memory 是 AWS 的全托管服务,使 AI 智能体能够跨对话持久保存信息,并按实体组织在隔离的命名空间中。
元数据过滤如何提高检索准确率?
属性过滤器(优先级、部门、时间范围)在向量相似性搜索之前应用,从而缩小候选集,防止语义相似但不相关的结果污染信号。
STRICTLY_CONSISTENT 元数据提取保证了什么?
管理员输入的值会原样传播,不经过 LLM 干预,这确保了在受监管环境中不同部门或合规级别之间的严格隔离。