arXiv:2606.22844: RaMem, 장기 에이전트 메모리의 맥락 붕괴 해결
RaMem은 에이전트 메모리 시스템에서 맥락 붕괴를 방지하는 4단계 프레임워크입니다. 맥락 붕괴는 압축된 단편이 주변 맥락을 잃고 동등하게 관련성 있는 것으로 잘못 불러와지는 상태입니다. 장기 메모리 벤치마크에서 기존 기준 시스템 대비 평균 F1 점수 10% 이상 향상을 달성합니다.
이 기사는 AI가 1차 출처를 기반으로 생성했습니다.
에이전트가 잊고 잘못 기억하는 이유
언어 에이전트의 장기 메모리에는 함정이 있습니다. 시스템이 과거 상호작용을 짧은 단편으로 압축하면 해당 단편들은 원래의 에피소드적 맥락, 즉 대화에 누가 참여했는지, 언제 발생했는지, 어떤 세션에서였는지를 잃게 됩니다. 결과는 맥락 붕괴로, 검색 모듈이 완전히 다른 상황의 단편들을 동등하게 관련성 있는 것으로 보고 잘못된 기억을 반환하는 상태입니다. USC와 관련 기관의 팀이 이 문제를 체계적으로 해결하기 위해 RaMem을 제안했습니다.
신뢰할 수 있는 기억 회상의 4단계
RaMem은 관련성 검증의 4단계 체인으로 작동합니다.
증거 앵커링이 첫 번째 단계입니다. 각 기억은 저장 시 에피소드적 앵커를 받습니다. 시간, 참가자, 세션 식별자가 기록됩니다. 이 앵커 없이는 검색이 저장 맥락과 쿼리 맥락을 비교할 수 없습니다.
회상 조건 유도는 쿼리가 암묵적으로 가정하는 조건을 추출합니다. 에이전트가 『지난주에 Mark와 무엇을 합의했나요?』라고 물으면 시스템은 자동으로 시간적·참가자 차원을 검색 조건으로 도출합니다.
유효성 인식 검색은 에피소드적 앵커가 도출된 조건과 일치하는 단편을 우선시합니다. 단순히 의미적 유사성만으로 순위를 매기는 것이 아닙니다.
맥락 보존 합성은 마지막으로 구조화된 맥락을 유지하면서 응답을 조합해 생성 중 2차 붕괴를 방지합니다.
강력한 기준 시스템 대비 F1 10% 이상 향상
표준 장기 메모리 벤치마크에서 RaMem은 기존 메모리 시스템 대비 평균 F1 점수 10% 이상 향상을 달성합니다. 핵심 장점은 모델 독립성입니다. 아키텍처 수정 없이 다양한 기반 언어 모델과 함께 작동합니다. 이 논문은 2026년 6월 22일 arXiv(cs.AI, cs.MA)에 제출되었으며, 저자는 USC의 Wei Yang, Bryce Kan 및 공동 연구자들입니다.
자주 묻는 질문
- 맥락 붕괴란 무엇이며 에이전트에 어떤 해를 끼칩니까?
- 맥락 붕괴는 메모리 시스템이 서로 다른 상황의 단편을 압축해 시간적·세션적·참가자 맥락을 잃을 때 발생합니다. 그러면 검색이 진정한 관련성을 평가할 수 없어 잘못된 기억을 반환합니다.
- RaMem은 기존 시스템과 비교해 정확도를 얼마나 향상시킵니까?
- 여러 장기 메모리 벤치마크에서 RaMem은 특정 기반 언어 모델에 관계없이 강력한 기준 시스템 대비 평균 F1 점수 10% 이상 향상을 달성합니다.