arXiv: Memory curse degradira LLM agent suradnju

Memory curse je fenomen u kojem proširenje povijesti dostupne LLM agentu degradira kooperativnost u multi-agent igrama — 18 od 28 model-igra kombinacija pokazuje erozija 'forward-looking intenta'. Sanitizacija memorijskog sadržaja (zamjena sintetičkim kooperativnim zapisima) bitno obnavlja suradnju, dok puko skraćivanje promptova ne pomaže.

Istraživački tim od deset autora — uključujući Jiayuan Liu, Tianqin Li i Shiyi Du — objavio je 11. svibnja 2026. studiju o kontraintuitivnom fenomenu nazvanom “memory curse” u multi-agent LLM scenarijima. Rad je dostupan na arXiv:2605.08060.

Kako su istraživači testirali fenomen?

Studija je obuhvatila 7 LLM-ova kroz 4 različite igre tijekom 500 rundi po konfiguraciji. Tri komplementarne metode analize korištene su za izolaciju mehanizama koji povezuju memoriju s degradacijom suradnje. Rezultat: u 18 od 28 model-igra kombinacija proširenje povijesti dostupne agentu degradira kooperativno ponašanje.

Što je glavni uzrok degradacije?

Leksička analiza 378.000 reasoning tragova otkrila je da je glavni mehanizam erozija “forward-looking intenta” — agenti postaju manje orijentirani prema budućim koracima i posljedicama. Rastuća paranoja nije bila uzrok, što je samo po sebi iznenađujuće. Fine-tuning kroz LoRA adaptere trenirane na forward-looking tragovima ublažava degradaciju i prenosi se na nove igre koje model nije vidio.

Kako sanitizacija memorije obnavlja suradnju?

Zamjena vidljive povijesti sintetičkim kooperativnim zapisima — uz održavanje iste duljine prompta — bitno obnavlja kooperativnost. Ovo dokazuje da okidač nije duljina konteksta nego sadržaj memorije. Implikacija za multi-agent sustave je značajna: dizajneri moraju aktivno kurirati što agent “pamti”, a ne samo skraćivati istoriju.

Što paradoks chain-of-thoughta otkriva?

Uklanjanje eksplicitnog reasoninga često je reduciralo kolaps suradnje. Autori zaključuju: “Memorija funkcionira kao aktivna bihevioralna determinanta — dulje sjećanje može destabilizirati ili podržati suradnju ovisno o obrascima razmišljanja koje pokreće.” Za dizajnere agentskih sustava ovo znači da CoT nije univerzalno korisna tehnika u multi-agent kontekstima.

Česta pitanja

Što točno znači 'forward-looking intent erosion'?

Forward-looking intent je sklonost agenta da razmišlja o budućim koracima i posljedicama svojih odluka. Leksička analiza 378.000 reasoning tragova pokazala je da pad kooperativnosti nije povezan s rastom paranoje, nego s erozijom orijentacije prema budućnosti — agenti postaju reaktivni umjesto strateški.

Kako memorijska sanitizacija rješava problem?

Istraživači su zamijenili vidljivu povijest sintetičkim kooperativnim zapisima istog tokenskog duljine. Suradnja se značajno obnovila, dokazujući da okidač nije duljina prompta nego sadržaj memorije. Fine-tuning kroz LoRA adaptere trenirane na forward-looking tragovima također ublažava degradaciju i transferira se na nove igre.

Zašto chain-of-thought pojačava memory curse?

Paradoksalno, uklanjanje eksplicitnog reasoninga često reducira kolaps suradnje. Autori sugeriraju da deliberacija pojačava memory curse — duboko razmišljanje nad konfliktnom poviješću navodi agente da racionaliziraju nekooperativna ponašanja koja bi inače izbjegli.

arXiv:2605.08060: Memory Curse — više pamćenja LLM agenta = MANJA kooperativnost u multi-agent scenarijima

Kako su istraživači testirali fenomen?

Što je glavni uzrok degradacije?

Kako sanitizacija memorije obnavlja suradnju?

Što paradoks chain-of-thoughta otkriva?

Česta pitanja

Izvori

Povezane vijesti