🟢 🤝 Agenti Objavljeno: · 3 min čitanja ·

AutoMem: memorijsko upravljanje kao naučiva vještina, ne arhitekturni izbor

Editorial ilustracija: Memorija kao naučiva kognitivna vještina — graph engine za učenje i pamćenje agenata

Istraživači sa Stanforda razvili su AutoMem — sustav s dvije optimizacijske petlje koji automatski uči kako organizirati i koristiti memoriju, bez ljudske anotacije, postižući 2–4× poboljšanje nad baselineima.

🤖

Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.

Jedan od dugogodišnjih izazova za AI agente jest memorija — kako pamtiti što je relevantno, kada zaboraviti staro i kako strukturirati pohranjena znanja za buduću upotrebu. Dosadašnji pristupi uglavnom su memorijsku arhitekturu tretirali kao fiksni dizajnerski izbor: inženjeri unaprijed odluče o strukturi i pravilima, a agent ih slijedi.

Nova studija sa Stanforda predlaže fundamentalno drugačiji pristup: memorijsko upravljanje je vještina koju agent može naučiti — i tu vještinu treba optimizirati automatski, paralelno s učenjem na zadatku.

Što je AutoMem i kako radi?

Rad „AutoMem: Automated Learning of Memory as a Cognitive Skill” autora Shengguanga Wua, Hao Zhua, Yuhui Zhanga, Xiaohan Wanga i Serene Yeung-Levy oslanja se na uvid iz kognitivnih znanosti: metamemory, ili sposobnost upravljanja vlastitim pamćenjem, jest odvojena vještina koja se može vježbati i unapređivati neovisno o sadržaju koji se pamti.

AutoMem implementira taj uvid kroz dvije automatizirane optimizacijske petlje koje rade usporedno.

Prva, nazvana Structure Loop, zadužena je za arhitekturu memorije — konkretno, za promptove koji opisuju kako agent treba koristiti memoriju, sheme za organizaciju podataka i rječnik memorijskih akcija (operacija poput pisanja, čitanja i brisanja datoteka). Moćan LLM iterativno analizira kompletne trajektorije agenata i predlaže poboljšanja tih komponenti.

Druga petlja, Proficiency Loop, fokusirana je na vještinu agenta u korištenju već definirane memorijske arhitekture. Uspješne memorijske odluke prikupljene iz više epizoda postaju trening signal koji fino podešava model — podučavajući ga kada i kako koristiti memoriju na najefikasnije načine.

Ključno: nijedna petlja ne zahtijeva ljudsku anotaciju memorijskih strategija. Cijeli sustav otkriva što funkcionira kroz iskustvo, ne kroz eksplicitno programirana pravila.

Rezultati: model od 32B parametara parira frontier sustavima

Autori su evaluirali AutoMem na tri proceduralno generirana okruženja za igre dugog horizonta: Crafter, MiniHack i NetHack. Ove igre zahtijevaju planiranje kroz stotine ili tisuće koraka, pamćenje prethodnih stanja i prilagođavanje strategije — što ih čini prirodnim testnim okruženjem za memorijske sposobnosti.

Rezultati su izraziti: AutoMem postiže 2× do 4× poboljšanje učinka nad baselineima — i to isključivo kroz optimizaciju memorijskog sustava, bez promjena u arhitekturi samog modela.

Što je posebno zanimljivo, model od 32B parametara opremljen AutoMemom postiže rezultate konkurentne frontier modelima mnogo većih razmjera. Ovo je direktna ilustracija teze rada: kada je memorijska arhitektura ko-optimizirana s učinkom na zadatku, manji modeli mogu nadoknaditi deficit u sirovoj veličini.

Zašto je ko-optimizacija memorije i zadatka važna

Standardni pristup pri dizajnu AI agenata jest da se memorijska arhitektura odluči unaprijed — u fazi dizajna sustava — a zatim fiksira. Agent potom uči kako riješiti zadatak uz tu fiksnu memorijsku strukturu.

AutoMem pokazuje da je ovo suboptimalno. Memorijska arhitektura i vještina agenta trebaju se razvijati zajedno — jer optimalna memorijska struktura ovisi o tome što agent treba postići, a sposobnost agenta ograničena je memorijskim strukturama koje su mu dostupne.

Ova perspektiva, inspirirana kognitivnom psihologijom, otvara pitanje koliko je sposobnosti AI agenata dosad ostalo neiskorišteno zbog toga što je memorija bila tretirana kao unaprijed riješeni problem, a ne kao varijabla koja se optimizira.

Za praktičare koji grade AI agente za dugohorizontske zadatke — od automatiziranog istraživanja i planiranja do dugotrajnih suradničkih projekata — AutoMem sugerira da bi memorijsku arhitekturu trebalo uključiti u petlju evaluacije i optimizacije, a ne prepustiti ručnom dizajnu.

Česta pitanja

Što su dvije optimizacijske petlje u AutoMemu?
Prva petlja (Structure Loop) koristi moćan LLM za iterativno poboljšanje arhitekture memorije — prompta, shema i rječnika akcija. Druga petlja (Proficiency Loop) pretvara uspješne memorijske odluke iz više epizoda u trening signal koji poboljšava vještinu agenta.
Na kojim je testovima AutoMem evaluiran i koliki su dobici?
Sustav je testiran na tri proceduralno generirana okruženja za igre dugog horizonta: Crafter, MiniHack i NetHack. Poboljšanje nad baselineima iznosi 2× do 4× samo kroz optimizaciju memorije.
Treba li AutoMem ljudsku anotaciju memorijskih strategija?
Ne — cijela petlja je potpuno automatizirana. Sustav sam otkriva koje su memorijske strategije učinkovite kroz analizu trajektorija agenata, bez ikakve ljudske oznake ili definiranja pravila.