🟢 🤝 에이전트 게시일: · 3 분 읽기 ·

AutoMem: 메모리 관리를 아키텍처적 선택이 아닌 학습 가능한 기술로

에디토리얼 일러스트레이션: 학습 가능한 인지 기술로서의 메모리 — 에이전트 학습 및 기억을 위한 그래프 엔진

스탠퍼드 연구자들이 인간의 주석 없이 메모리 구성 및 사용 방법을 자동으로 학습하는 두 개의 최적화 루프를 가진 시스템 AutoMem을 개발했다. 기준선 대비 2~4배 성능 향상을 달성했다.

🤖

이 기사는 AI가 1차 출처를 기반으로 생성했습니다.

AI 에이전트에게 오랫동안 어려운 과제로 남아 있던 것 중 하나가 메모리다 — 무엇이 관련 있는지 기억하고, 언제 오래된 것을 잊을지, 미래 사용을 위해 저장된 지식을 어떻게 구조화할지. 기존 접근 방식들은 대체로 메모리 아키텍처를 고정된 설계 선택으로 취급했다: 엔지니어가 미리 구조와 규칙을 결정하면 에이전트가 이를 따랐다.

스탠퍼드의 새 연구는 근본적으로 다른 접근 방식을 제안한다: 메모리 관리는 에이전트가 학습할 수 있는 기술이다 — 그리고 이 기술은 태스크 학습과 병행하여 자동으로 최적화되어야 한다.

AutoMem이란 무엇이며 어떻게 작동하는가?

Shengguang Wu, Hao Zhu, Yuhui Zhang, Xiaohan Wang, Serene Yeung-Levy가 저술한 논문 「AutoMem: Automated Learning of Memory as a Cognitive Skill」은 인지과학의 통찰에 기반한다: 메타메모리, 즉 자신의 기억을 관리하는 능력은 기억되는 내용과 독립적으로 연습하고 향상시킬 수 있는 별개의 기술이다.

AutoMem은 이 통찰을 두 개의 자동화된 최적화 루프를 통해 구현하며, 두 루프는 병행하여 작동한다.

첫 번째 루프, 구조 루프(Structure Loop)는 메모리 아키텍처를 담당한다 — 구체적으로는 에이전트가 메모리를 사용하는 방법을 설명하는 프롬프트, 데이터 구성 스키마, 메모리 액션 어휘(파일 쓰기, 읽기, 삭제 같은 작업). 강력한 LLM이 에이전트의 완전한 궤적을 반복적으로 분석하고 이런 구성 요소의 개선을 제안한다.

두 번째 루프, 숙련도 루프(Proficiency Loop)는 이미 정의된 메모리 아키텍처를 사용하는 에이전트의 기술에 집중한다. 여러 에피소드에서 수집된 성공적인 메모리 결정이 모델을 미세 조정하는 훈련 신호가 된다 — 언제 어떻게 가장 효율적으로 메모리를 사용하는지를 가르친다.

핵심: 어느 루프도 메모리 전략에 대한 인간 주석을 필요로 하지 않는다. 전체 시스템은 명시적으로 프로그래밍된 규칙이 아닌 경험을 통해 무엇이 효과적인지 발견한다.

결과: 32B 파라미터 모델이 프런티어 시스템과 대등

저자들은 AutoMem을 장기 게임을 위한 세 가지 절차적으로 생성된 환경에서 평가했다: Crafter, MiniHack, NetHack. 이 게임들은 수백 또는 수천 단계에 걸친 계획, 이전 상태의 기억, 전략 적응이 필요하여 메모리 능력을 위한 자연스러운 테스트 환경이다.

결과는 두드러진다: AutoMem은 기준선 대비 2~4배 성능 향상을 달성했다 — 모델 아키텍처 자체의 변경 없이 오직 메모리 시스템 최적화만으로.

특히 흥미로운 것은 32B 파라미터 모델이 AutoMem을 갖추었을 때 훨씬 더 큰 규모의 프런티어 모델과 경쟁할 만한 결과를 달성했다는 점이다. 이것은 논문의 명제를 직접 보여준다: 메모리 아키텍처가 태스크 성능과 공동 최적화되면 소형 모델이 원시 규모의 부족함을 만회할 수 있다.

메모리와 태스크의 공동 최적화가 왜 중요한가

AI 에이전트를 설계할 때의 표준 접근 방식은 메모리 아키텍처를 미리 — 시스템 설계 단계에서 — 결정한 다음 고정하는 것이다. 에이전트는 그 고정된 메모리 구조로 태스크를 해결하는 방법을 학습한다.

AutoMem은 이것이 차선책임을 보여준다. 메모리 아키텍처와 에이전트의 기술은 함께 발전해야 한다 — 최적의 메모리 구조는 에이전트가 달성해야 하는 것에 달려 있고, 에이전트의 능력은 이용 가능한 메모리 구조에 의해 제한되기 때문이다.

인지심리학에서 영감을 받은 이 관점은 메모리가 미리 해결된 문제로 취급되고 최적화 변수로 취급되지 않음으로써 지금까지 얼마나 많은 AI 에이전트 능력이 미활용 상태로 남아 있었는지에 대한 질문을 제기한다.

자동화된 연구와 계획에서 장기적인 협업 프로젝트까지 장기 태스크를 위한 AI 에이전트를 구축하는 실무자들에게 AutoMem은 메모리 아키텍처를 수동 설계에 맡기는 대신 평가 및 최적화 루프에 포함해야 한다는 것을 시사한다.

자주 묻는 질문

AutoMem의 두 가지 최적화 루프는 무엇인가?
첫 번째 루프(구조 루프)는 강력한 LLM을 사용하여 프롬프트, 스키마, 액션 어휘를 포함한 메모리 아키텍처를 반복적으로 개선한다. 두 번째 루프(숙련도 루프)는 여러 에피소드의 성공적인 메모리 결정을 에이전트의 기술을 향상시키는 훈련 신호로 변환한다.
AutoMem은 어떤 테스트에서 평가되었으며 성능 향상은 얼마인가?
시스템은 장기 게임 환경인 Crafter, MiniHack, NetHack 세 가지 절차적으로 생성된 환경에서 테스트되었다. 메모리 최적화만으로 기준선 대비 2~4배 향상을 달성했다.
AutoMem에 메모리 전략에 대한 인간 주석이 필요한가?
아니다 — 전체 루프는 완전히 자동화되어 있다. 시스템은 어떤 인간 레이블이나 규칙 정의 없이 에이전트 궤적 분석을 통해 효과적인 메모리 전략을 스스로 발견한다.