arXiv SAGE: 그래프 메모리 엔진에서 Recall@5 91.6% 달성

SAGE는 Juntong Wang 외 연구팀이 2026년 5월 12일 arXiv에 발표한 LLM 에이전트용 자기 진화형 그래프 메모리 엔진입니다. 메모리 라이터와 메모리 리더(그래프 기반 모델)의 피드백 루프를 사용하여 자율적으로 확장되고 재구성됩니다. Natural Questions 제로샷 오픈 도메인 검색에서 Recall@2/5가 각각 82.5/91.6을 기록하고, LongMemEval 및 HaluMem 환각 지표도 개선되었습니다.

Juntong Wang, Haoyue Zhao, Guanghui Pan, Xiyuan Wang, Yanbo Wang, Qiyan Deng, Muhan Zhang 팀은 2026년 5월 12일 SAGE를 발표했습니다. 언어 에이전트의 장기 메모리 한계와 구조화된 검색과 에이전트 피드백 간의 역학 관계를 해결하는 자기 진화형 그래프 메모리 엔진입니다.

기존 GraphRAG가 왜 부족합니까?

기존 RAG와 GraphRAG 시스템은 메모리 그래프를 정적 검색 인덱스로 취급합니다. 그래프 구축 후에는 변화가 없어 에이전트가 새로운 연결을 도입하거나 지식을 재구성할 수 없습니다. SAGE는 그래프의 구조적 역할(예: 노드는 엔터티, 엣지는 관계, 이웃은 컨텍스트)이 재사용 가능한 신호이며, 이를 통해 상호 작용 과정에서 메모리가 성숙할 수 있다는 전제에서 출발합니다.

메모리 라이터와 메모리 리더는 어떻게 협력합니까?

SAGE는 두 구성 요소를 피드백 루프로 통합합니다. 메모리 라이터는 에이전트의 상호 작용 이력에서 구조화된 그래프 메모리를 점진적으로 구축하며 노드, 엣지, 구조적 주석을 추가합니다. 메모리 리더는 그래프 기반 모델을 검색에 활용하고, 중요하게도 라이터에 피드백을 반환합니다. 어떤 노드와 엣지가 응답에 유용했는지, 구조의 어느 부분에서 문제가 발생했는지를 알려줍니다. 이 루프를 통해 메모리가 리더-라이터 통신을 거쳐 자율적으로 진화합니다.

벤치마크에서 구체적인 수치는 어떻습니까?

Natural Questions 제로샷 오픈 도메인 검색에서 Recall@2 82.5와 Recall@5 91.6을 달성했습니다. 자기 진화 2라운드 후 멀티홉 QA에서 최고 평균 순위를 기록하여 반복 피드백이 그래프 품질을 향상시킴을 확인했습니다. LongMemEval 및 HaluMem에서 장기 메모리와 환각 지표도 개선되었습니다.

훈련과 리더-라이터 피드백이 여러 성능 지표를 동시에 향상시켜, SAGE는 그래프 메모리를 장기 언어 에이전트의 기반으로 자리매김합니다. 개별 상호 작용이 성장하는 이전 지식 네트워크에 통합되어야 하는 시나리오를 위한 것입니다.

자주 묻는 질문

SAGE가 기존 GraphRAG 시스템과 다른 점은 무엇입니까?

기존 RAG와 GraphRAG 시스템은 메모리 그래프를 정적 검색 인덱스로 취급하지만, SAGE는 자기 진화를 통해 확장·재구성되는 동적 장기 메모리 기반으로 취급하며 그래프 내 구조적 역할을 활용해 메모리를 향상시킵니다.

벤치마크의 구체적인 결과는 어떻습니까?

Natural Questions 제로샷 오픈 도메인 검색에서 Recall@2 82.5, Recall@5 91.6을 달성했습니다. 자기 진화 2라운드 후 멀티홉 QA에서 최고 평균 순위를 기록했으며, LongMemEval 및 HaluMem에서 장기 메모리와 환각 지표도 개선되었습니다.

arXiv:2605.12061 SAGE: 자기 진화형 그래프 메모리 엔진이 Natural Questions에서 Recall@5 91.6% 달성

기존 GraphRAG가 왜 부족합니까?

메모리 라이터와 메모리 리더는 어떻게 협력합니까?

벤치마크에서 구체적인 수치는 어떻습니까?

자주 묻는 질문

출처

관련 뉴스