arXiv:2606.09900:Engram — バイテンポラルなメモリエンジン、トークン8分の1で+10.4ポイント
Engramは、巧みに検索された「リーン」なコンテキストが会話履歴全体の読み込みを上回ることを示すオープンソースのメモリシステムである。ベンチマークLongMemEval_Sでは、約8分の1のトークンを使いながら、フルコンテキストの73.2%に対して83.6%を達成した。
この記事はAIにより一次情報源から生成されました。
2026年6月5日11:43 UTCに公開されたarXiv:2606.09900は、Engramを提示する — これは巧みに検索された「リーン」なコンテキスト(簡潔で、的を絞って選ばれた情報の集合)が会話履歴全体の読み込みを上回ることを示すオープンソースのメモリシステムである。結果は、より多くのコンテキストが必ずしもより良い回答を意味するのではなく、検索の質が決定的であることを示唆している。
Engramとは何か、どの問題を解決するのか?
Engramは、不要な負荷をかけずに適切な時点で適切な知識をAIエージェントに提供するにはどうすればよいかという問いを扱う。一般的なアプローチは会話履歴全体をフルコンテキストとして読み込むことだが、これは多くのトークンを消費し、ノイズを持ち込みうる。
これとは対照的に、Engramは関連する部分のみを検索する。これにより、慎重に選ばれた簡潔なコンテキストが、モデルにすべてを一度に渡すアプローチよりも良い結果をもたらしうることを示している。これは量から関連性への転換である。
デュアルプロセス・アーキテクチャはどのように働くのか?
Engramは、バイテンポラルなデータモデルの上に構築されたデュアルプロセス・アーキテクチャ(2つのプロセスをもつアーキテクチャ)を用いる。第1のプロセスはLLM呼び出しなしでエピソードを追加する高速な書き込みパスであり、これにより新しい情報の書き込みは安価かつ高速になる。
第2のプロセスは、背後でバイテンポラルなナレッジグラフ(知識のグラフ)を構築する非同期パスである。これは原子的事実を抽出し、それらのあいだの矛盾を解消する。このような分担により、システムは新しいデータを高速に記録しつつ、整然とした一貫した知識モデルを徐々に構築することが同時に可能になる。
バイテンポラルなデータモデルとは何を意味するか?
バイテンポラルなモデルは、各情報について2つの時間次元を追跡する。すなわち、出来事がいつ起きたかと、いつ記録されたかである。この区別により、システムは出来事の時間的順序を正しく解釈し、後の情報が先の情報と矛盾する場合にそれを認識できる。
まさにこのモデルのおかげでEngramは、ナレッジグラフを構築しながら矛盾を解消できる。矛盾する主張を積み上げる代わりに、システムは時間を尊重した整合性のある知識像を維持する。
ベンチマークでの結果はどうか?
ベンチマークLongMemEval_SでEngramは83.6%を達成し、フルコンテキスト方式の73.2%を上回った。これは10.4ポイントの改善であり、統計的に非常に説得力がある(McNemar p < 10⁻⁶)。
最も印象的なのは性能とコストの比である。Engramは79kの代わりにわずか約9.6kの検索トークンを使い、これはおよそ8分の1のトークンである。その際、500問すべてで1つの誤りも記録しなかった。これにより論文の主要なテーゼが裏づけられる。すなわち、賢く簡潔な検索は、会話履歴全体の読み込みより同時に正確かつ著しく安価でありうる。
このアプローチはなぜAIエージェントにとって重要か?
長時間の会話を行ったり、多くのステップにわたって課題を遂行したりする自律的なAIエージェントにとって、メモリの管理は重要なボトルネックとなる。モデルのコンテキストウィンドウは限られており、それを大量の過去情報で満たすことはコストと誤りのリスクの両方を増大させる。
Engramはその問題への実践的な答えを提供する。オープンソースであるため、開発チームはクローズドな解決策に依存することなく、自らのエージェントに組み込める。LLM呼び出しなしの高速な書き込みパスと背後でのナレッジグラフ構築の組み合わせは、システムが会話履歴とともに成長しつつ、相互作用を遅くしないことを意味する。LongMemEval_Sでの結果は、このようなアプローチがエージェント向けのメモリ層を構築する際の標準になりうることを示唆している。
よくある質問
- Engramとは何ですか?
- Engramは、巧みに検索された簡潔な(「リーン」な)コンテキストが会話履歴全体の読み込みを上回ることを示す、AIエージェント向けのオープンソースのメモリシステムです。バイテンポラルなデータモデルに基づくデュアルプロセス・アーキテクチャを用います。目標は、トークン消費を大幅に抑えつつ関連情報を提供することです。
- バイテンポラルなデータモデルとは何を意味しますか?
- バイテンポラルなモデルはデータの2つの時間次元 — 何かが起きた時点と、それが記録された時点 — を追跡します。これにより、システムは時間的順序を尊重した知識を構築し、事実間の矛盾を解消できます。Engramはこれを基盤として、原子的事実のナレッジグラフを構築します。
- Engramはテストでどの程度成功しましたか?
- ベンチマークLongMemEval_SでEngramは、フルコンテキスト方式の73.2%に対して83.6%を達成し、これは10.4ポイントの改善です(McNemar p < 10⁻⁶)。79kの代わりに約9.6kの検索トークン、すなわちおよそ8分の1を使い、500問すべてで1つの誤りもありませんでした。