🟢 🤝 智能体 发布于: · 1 分钟阅读 ·

arXiv:2606.22844:RaMem解决长期Agent记忆中的上下文坍塌问题

arXiv:2606.22844 ↗

编辑插图:机器人Agent从按时间和会话上下文组织的发光记忆片段中检索信息

RaMem是一个四阶段框架,可防止Agent记忆系统中的上下文坍塌——即压缩片段失去周围上下文、被错误地视为同等相关的状态。在长期记忆基准测试中,相比现有基线系统平均F1分数提升超过10%。

🤖

本文由人工智能基于一手来源生成。

为何Agent会遗忘——并产生错误回忆

语言Agent的长期记忆隐藏着一个陷阱:当系统将过去的交互压缩为简短片段时,这些片段会失去原始的情节上下文——谁参与了对话、何时发生、在哪个会话中。结果是上下文坍塌——检索模块将完全不同情境下的片段视为同等相关并返回错误记忆。南加州大学及合作机构的团队提出RaMem,以系统性方式解决这一问题。

可靠回忆的四个步骤

RaMem以四阶段相关性验证链的形式运作。

证据锚定是第一步:每条记忆在存储时获得情节锚点——记录时间、参与者和会话标识符。没有这个锚点,检索模块就无法将存储上下文与查询上下文进行比对。

回忆条件归纳提取查询隐含的前提条件。如果Agent询问「上周我们和马克商定了什么?」,系统会自动推导出时间维度和参与者作为搜索条件。

有效性感知检索随后优先选择情节锚点与推导条件匹配的片段——而非仅按语义相似度排序。

保留上下文的合成最后在保留结构化上下文的同时组合答案,防止在生成阶段发生二次坍塌。

F1分数超越强基线10%以上

在标准长期记忆基准测试中,RaMem相比现有记忆系统平均F1分数提升超过10%。关键优势在于:该框架与模型无关——适用于不同的后端语言模型,无需修改架构。论文于2026年6月22日提交至arXiv(cs.AI, cs.MA),作者为南加州大学的Wei Yang、Bryce Kan及合作者。

常见问题

什么是上下文坍塌,为何它会损害Agent?
上下文坍塌发生在记忆系统压缩来自不同情境的片段,导致它们失去时间、会话和参与者信息时——检索模块随后无法评估真实相关性,并返回错误的记忆。
RaMem相比现有系统能提升多少准确率?
在多个长期记忆基准测试中,RaMem相比强基线系统平均F1分数提升超过10%,且与具体使用的后端语言模型无关。