arXiv:2605.08060 記憶の呪い：記憶増加でLLM協調性が低下

記憶の呪いとは、LLMエージェントが利用できる履歴を拡張するとマルチエージェントゲームでの協調行動が低下する現象です——28のモデル-ゲーム組み合わせのうち18で「前向き意図」の侵食が確認されました。記憶内容の衛生化（合成的な協調記録への置換）が協調性を大幅に回復させる一方、単純なプロンプト短縮は効果がありません。

Jiayuan Liu、Tianqin Li、Shiyi Duを含む10名の著者による研究チームは2026年5月11日、マルチエージェントLLMシナリオにおける「記憶の呪い」と呼ばれる反直感的な現象に関する研究を発表しました。論文はarXiv:2605.08060で公開されています。

研究者たちはこの現象をどのようにテストしたか？

研究は7つのLLMを4つの異なるゲームで設定ごとに500ラウンドにわたってテストしました。記憶と協調性の低下を結びつけるメカニズムを分離するために3つの補完的な分析手法を使用しました。結果：28のモデル-ゲーム組み合わせのうち18で、エージェントが利用できる履歴を拡張すると協調的行動が低下しました。

劣化の主な原因は何か？

378,000件の推論トレースの語彙分析から、主なメカニズムは「前向き意図」の侵食であることが明らかになりました——エージェントが将来のステップと結果への指向性が低下します。増大するパラノイアは原因ではなく、これ自体が驚きです。前向きトレースで訓練されたLoRAアダプターによるファインチューニングは劣化を緩和し、モデルが見たことのない新しいゲームに転移します。

記憶の衛生化はどのように協調性を回復させるか？

可視履歴を合成的な協調記録に置き換えること——プロンプトの長さを同一に保ちながら——は協調性を大幅に回復させます。これはトリガーがコンテキスト長ではなく記憶の内容であることを証明します。マルチエージェントシステムへの重要な示唆：設計者は単に履歴を切り詰めるのではなく、エージェントが「記憶する」内容を積極的にキュレーションしなければなりません。

chain-of-thoughtのパラドックスは何を明らかにするか？

明示的な推論を取り除くと協調性の崩壊が減少することが多いです。著者らは「記憶は能動的な行動決定因子として機能し——より長い記憶は、それが引き起こす思考パターンに応じて協調性を安定させることも不安定にすることもある」と結論付けています。エージェントシステムの設計者にとって、これはchain-of-thoughtがマルチエージェントコンテキストで普遍的に有益な技術ではないことを意味します。

よくある質問

「前向き意図の侵食」とは正確に何を意味するか？

前向き意図とは、エージェントが将来のステップと自分の決定の結果について考える傾向のことです。378,000件の推論トレースの語彙分析から、協調性の低下はパラノイアの増大とは無関係で、未来志向の低下と関連していることが示されました——エージェントは戦略的ではなく反応的になっていきます。

記憶の衛生化はどのように問題を解決するか？

研究者たちは可視履歴を同じトークン長の合成的な協調記録に置き換えました。協調性が大幅に回復し、トリガーはプロンプトの長さではなく記憶の内容であることが証明されました。前向きトレースで訓練されたLoRAアダプターによるファインチューニングも劣化を緩和し、新しいゲームに転移します。

なぜchain-of-thoughtが記憶の呪いを増幅させるのか？

逆説的に、明示的な推論を取り除くと協調性の崩壊が減少することが多いです。著者らは熟考が記憶の呪いを増幅させると示唆しています——対立的な履歴についての深い推論は、エージェントが本来避けられたはずの非協調的行動を正当化する方向に向かわせます。

arXiv:2605.08060: 記憶の呪い——LLMエージェントの記憶が多いほど、マルチエージェントシナリオでの協調性が低下する

研究者たちはこの現象をどのようにテストしたか？

劣化の主な原因は何か？

記憶の衛生化はどのように協調性を回復させるか？

chain-of-thoughtのパラドックスは何を明らかにするか？

よくある質問

出典

関連ニュース