arXiv:2606.22844: RaMem——長期エージェントメモリのコンテキスト崩壊を解決
RaMeMは、エージェントメモリシステムにおけるコンテキスト崩壊——圧縮されたフラグメントが周囲のコンテキストを失い、同等に関連性があるように誤って取得される状態——を防ぐ4フェーズのフレームワークです。長期メモリベンチマークで既存のベースラインと比較して平均F1スコアが10%以上向上しました。
この記事はAIにより一次情報源から生成されました。
エージェントはなぜ忘れるのか——そして誤った記憶を持つのか
言語エージェントの長期メモリには落とし穴があります。システムが過去のインタラクションを短いフラグメントに圧縮すると、それらのフラグメントは元のエピソード的コンテキスト——会話に誰がいたか、いつ起きたか、どのセッションで起きたか——を失います。結果はコンテキスト崩壊——取得モジュールが完全に異なる状況からのフラグメントを同等に関連性があると見なし、間違った記憶を返す状態——です。南カリフォルニア大学と関連機関のチームは、この問題を体系的に解決するためにRaMeMを提案しています。
信頼性の高い記憶のための4ステップ
RaMeMは4フェーズの関連性チェックチェーンとして機能します。
証拠のアンカリングが最初のステップです。各記憶は保存時にエピソード的なアンカーを受け取ります——時刻、参加者、セッション識別子が記録されます。このアンカーがなければ、取得モジュールは保存コンテキストとクエリコンテキストを比較できません。
想起条件の誘導はクエリが暗黙的に前提としている条件を引き出します。エージェントが「先週マルコと何を合意しましたか?」と尋ねると、システムは自動的に時間的および参加者の次元を検索条件として導出します。
有効性を考慮した取得は、エピソード的なアンカーが導出された条件と一致するフラグメントを優先します——意味的類似性のみに基づいてランク付けするのではなく。
コンテキストが保持された合成は最後に構造化されたコンテキストを維持しながら応答を組み立て、生成時の二次的な崩壊を防ぎます。
強力なベースラインより10%以上のF1向上
標準的な長期メモリベンチマークにおいて、RaMeMは既存のメモリシステムと比較して平均F1スコアが10%以上向上します。重要な利点:このフレームワークはモデルに依存しない——アーキテクチャを修正することなくさまざまな基盤言語モデルで機能します。この論文は2026年6月22日にarXivに提出されました(cs.AI、cs.MA)。著者は南カリフォルニア大学のWei Yang、Bryce Kan、および共同研究者たちです。
よくある質問
- コンテキスト崩壊とは何ですか?なぜエージェントに害を及ぼすのですか?
- コンテキスト崩壊は、メモリシステムがさまざまな状況のフラグメントを圧縮するときに、それらが時間的・セッション的・参加者的なコンテキストを失うことで発生します——その結果、取得モジュールは真の関連性を評価できず、誤った記憶を返します。
- RaMeMは既存のシステムと比べてどれほど精度を向上させますか?
- 複数の長期メモリベンチマークにおいて、RaMeMは強力なベースラインシステムと比較して平均F1スコアが10%以上向上します。これは使用する基盤言語モデルに関わらず実現されます。