AgentCore Memory란 무엇이며 어떤 용도로 사용하나요?

AgentCore Memory는 AI 에이전트가 엔터티별 격리된 네임스페이스로 구성된 대화 전반에 걸쳐 정보를 영구적으로 기억할 수 있게 해주는 AWS의 완전 관리형 서비스입니다.

메타데이터 필터링이 검색 정확도를 어떻게 향상시키나요?

속성 필터(우선순위, 부서, 시간 범위)가 벡터 유사도 검색 이전에 적용되어 후보 집합을 좁힙니다. 시맨틱으로 유사하지만 관련 없는 결과가 신호를 오염시키지 않습니다.

STRICTLY_CONSISTENT 메타데이터 추출이 보장하는 것은?

관리자가 입력한 값이 LLM 개입 없이 그대로 전파되어 규제 환경에서 부서 또는 컴플라이언스 수준 간의 엄격한 격리를 보장합니다.

AWS AgentCore Memory: 메타데이터 필터링으로 정확도 64% 달성

Amazon Bedrock AgentCore Memory가 시맨틱 검색 이전에 적용되는 속성 메타데이터 필터링을 도입했습니다. 151개 질문 벤치마크에서 전체 정확도가 40%에서 64%로, 컨텍스트 의존형 쿼리는 16%에서 69%로 향상되었습니다.

Amazon Web Services가 Amazon Bedrock 플랫폼 내 AgentCore Memory 서비스에 중요한 개선사항을 발표했습니다. 구조화된 메타데이터 필터링으로 AI 에이전트의 정보 검색 정밀도를 획기적으로 향상시킵니다.

시맨틱 검색만으로는 왜 부족한가?

기존 AI 에이전트 메모리 시스템은 벡터 유사도 검색에만 의존했습니다. 에이전트가 쿼리를 던지면 시스템이 시맨틱으로 가장 유사한 레코드를 찾아 컨텍스트로 반환하는 방식입니다. 아카이브가 크고 다양할 때 문제가 발생합니다. 시맨틱으로 유사하지만 전혀 관련 없는 정보가 관련 신호를 압도할 수 있습니다.

고객 포트폴리오를 관리하는 에이전트를 상상해 보세요. 「Q3의 우선순위 업무는?」이라는 질문은 3분기의 최우선 항목만 가져와야 하지, 우선순위나 분기에 관한 모든 문서를 가져와서는 안 됩니다. 추가 필터 없이는 시맨틱 검색이 그 차이를 만들 수 없습니다.

AgentCore Memory는 벡터 알고리즘이 유사도를 계산하기 전에 후보 집합을 좁히는 속성 사전 필터인 메타데이터를 도입해 이 문제를 해결합니다.

3단계 메모리 생명주기

새 시스템은 세 가지 명확하게 구분된 단계로 동작합니다.

구성이 첫 번째 단계입니다. 관리자가 시스템이 인덱싱할 메타데이터 키와 적용할 추출 스키마를 정의합니다. AgentCore Memory는 STRING, STRINGLIST, NUMBER, DATETIME 타입을 지원하며, 각 메모리 리소스는 최대 10개의 인덱싱된 키를 가질 수 있습니다.

수집이 두 번째 단계입니다. 메타데이터는 두 가지 방식으로 메모리 이벤트에 연결됩니다. LLM이 대화 내용에서 값을 추론하는 자동 추출 방식이 있고, 값이 이미 알려진 대규모 가져오기를 위한 직접 API 입력 방식도 있습니다.

검색이 세 번째이자 핵심 단계입니다. 메타데이터 필터가 네임스페이스 내 전체 레코드 집합에 적용되고, KNN 알고리즘이 좁혀진 집합 내에서만 유사도를 검색하며, 결합된 결과가 에이전트에게 반환됩니다. 순서는 우연이 아닙니다. 사전 필터는 벡터 검색이 고려해야 하는 후보 수를 극적으로 줄입니다.

벤치마크: 컨텍스트 의존형 쿼리 16%에서 69%로

측정은 시간 제한 검색, 우선순위 필터링, 부서 내 검색 등 다양한 쿼리 유형을 포함하는 151개 질문 세트로 진행되었습니다.

메타데이터 필터링 없이는 전체 정확도가 **40%**입니다. 필터링을 활성화하면 **64%**로 올라가 24 퍼센트포인트 향상됩니다. 가장 극적인 개선은 컨텍스트 의존형 질문에서 나타납니다. 정확도가 **16%에서 69%**로 상승해 「지난 주 긴급 우선순위 합의 사항은?」 같은 쿼리가 실제로 사용 가능한 수준이 되었습니다.

STRICTLY_CONSISTENT: LLM 가변성 방어

규제 환경에서 특히 중요한 혁신은 STRICTLY_CONSISTENT 추출 유형입니다. 표준 추출에서는 LLM이 컨텍스트에서 메타데이터 값을 추론할 수 있습니다. 요약 같은 유연한 속성에는 유용하지만 절대적으로 신뢰할 수 있어야 하는 분류자에는 위험합니다.

STRICTLY_CONSISTENT 키는 LLM 개입 없이 값을 그대로 전파합니다. 다른 결정론적 값을 가진 레코드는 절대 병합되지 않습니다. 전략당 최대 3개의 키가 허용됩니다. 결과적으로 멀티테넌트 환경에서 서로 다른 기밀 수준이나 법적 관할권 간의 엄격한 격리가 이루어집니다.

기반으로서의 네임스페이스 격리

아키텍처는 두 가지 격리 수준을 구분합니다. 네임스페이스(예: clients/client-123 또는 patients/patient-456)는 데이터 소유자인 누구를 정의합니다. 이것이 1차적인 강한 경계입니다. 해당 네임스페이스 내의 메타데이터는 무엇을 언제를 정의합니다. 부서, 상태, 시간대 같은 비즈니스 차원입니다.

이 계층 구조는 동일한 클라이언트 공간 내에서도 에이전트가 오래된 인터랙션이나 무관한 인터랙션에 노출되지 않고 현재 프로젝트와 관련된 레코드만 검색할 수 있음을 의미합니다.

실제 적용 사례

AWS는 몇 가지 핵심 시나리오를 제시합니다. 서로 다른 부서가 인프라를 공유하지만 격리된 메모리 뷰를 가져야 하는 멀티테넌트 SaaS 플랫폼, 메타데이터 컴플라이언스 필터를 통해 HIPAA 요구사항을 구현하는 의료, 에스컬레이션 우선순위에 따른 자동 라우팅이 필요한 고객 지원, 분기별 또는 규제 기한에 따른 정밀한 시간 필터링이 필요한 금융 서비스입니다.

시스템은 LATEST_VALUE 규칙(최신 값 우선) 또는 사용자 정의 도메인 지시를 통해 충돌을 해결합니다. 스키마는 추가적이며 키를 추가할 수 있지만 제거할 수 없어 장기 프로덕션 배포에서 하위 호환성이 보장됩니다.

AWS AgentCore Memory에 메타데이터 필터링 추가 — 정확도 40%에서 64%로 상승