AWS AgentCore Memoryがメタデータフィルタリングを導入——精度が40%から64%に向上
Amazon Bedrock AgentCore Memoryがセマンティック検索の前に適用される属性メタデータフィルタリングを導入した。151問のベンチマークで全体の精度が40%から64%に向上し、コンテキスト依存クエリでは16%から69%に改善した。
この記事はAIにより一次情報源から生成されました。
Amazon Web ServicesはAmazon Bedrock内のAgentCore Memoryサービスに大幅な機能強化を発表した——AIエージェントの情報取得精度を劇的に向上させる、メタデータによる構造化フィルタリングだ。
なぜセマンティック検索だけでは不十分か?
これまでのAIエージェント向けメモリシステムはベクトル類似性検索だけに頼っていた。エージェントがクエリを投げると、システムが意味的に最も類似したレコードを見つけてコンテキストとして返す。問題は、アーカイブが大きく多様な場合に発生する——意味的には関連しているが完全に無関係な情報が関連シグナルを上回る可能性がある。
クライアントのポートフォリオを管理するエージェントを想像してほしい。「Q3の優先タスクは何か?」という質問には、第3四半期の高優先度のアイテムだけが返るべきで、優先度や四半期に関するすべての文書が返るべきではない。追加のフィルターなしに、セマンティック検索はその区別ができない。
AgentCore Memoryは属性プレフィルターを導入することでこれを解決する——ベクトルアルゴリズムが類似性の計算を開始する前に候補セットを絞り込むメタデータだ。
メモリの3フェーズライフサイクル
新システムは3つの明確に分離されたステップで機能する。
設定が最初のステップ:管理者がシステムがどのメタデータキーをインデックスし、どの抽出スキーマを適用するかを定義する。AgentCore MemoryはSTRING、STRINGLIST、NUMBER、DATETIME型をサポートし、各メモリリソースは最大10のインデックスキーを持てる。
取り込みが2番目のステップ:メタデータはメモリイベントに2つの方法で付与される。LLMが会話内容から値を推論する自動抽出、または値がすでにわかっている一括インポート向けの直接API入力だ。
取得が3番目で重要なステップ:メタデータフィルターがネームスペース内のすべてのレコードに適用され、KNNアルゴリズムがその絞り込まれたセット内でのみ類似性を検索し、組み合わされた結果がエージェントに返される。順序は偶然ではない——プレフィルターはベクトル検索が考慮すべき候補数を大幅に削減する。
ベンチマーク:コンテキスト依存クエリが16%から69%へ
測定は151問のセットで実施され、時間制限付き検索、優先度フィルタリング、部署内検索など様々なクエリタイプをカバーした。
メタデータフィルタリングなしの全体精度は40%。フィルタリングを有効にすると**64%に向上——24パーセントポイントの増加だ。最も劇的な跳ね上がりはコンテキスト依存の質問で見られた。精度が16%から69%**に向上し、「先週のurge優先度のミーティングはどれか?」のようなクエリが実用的に使えるようになった。
STRICTLY_CONSISTENT:LLMの変動からの保護
規制された環境にとって特に重要なイノベーションがSTRICTLY_CONSISTENT抽出タイプだ。標準的な抽出ではLLMがコンテキストからメタデータ値を推論できる——柔軟な属性(要約など)には便利だが、絶対的に信頼性が必要な分類器には危険だ。
STRICTLY_CONSISTENTキーは値をLLMの介入なしにそのまま伝播させる。異なる決定論的値を持つレコードは決してマージされない。1つのストラテジーにつき最大3つのキーが許可される。結果として、マルチテナント環境での異なる機密レベルや法的管轄間の厳格な分離が実現する。
基盤としてのNamespace分離
アーキテクチャは2レベルの分離を分けている。Namespace(例:clients/client-123またはpatients/patient-456)は誰がデータを所有するかを定義する——これが一次的な厳格な境界だ。そのNamespace内のメタデータは何を、いつ——部署、ステータス、時間枠などのビジネス次元を定義する。
この階層により、同じクライアントスペース内でも、エージェントは古いまたは無関係なインタラクションを露出させることなく、現在のプロジェクトに関連するレコードだけを取得できる。
実際のユースケース
AWSはいくつかの主要シナリオを挙げている。異なる部署がインフラを共有しながらもメモリの分離されたビューを持つ必要があるマルチテナントSaaSプラットフォーム、メタデータ準拠フィルターでHIPAA要件を実装する医療、エスカレーション優先度による自動ルーティングを行うカスタマーサポート、四半期や規制期限による精密な時間フィルタリングを行う金融サービス。
システムはLATEST_VALUEルール(最新値が優先)またはカスタムドメイン指示で競合を解決する。スキーマは加法的——キーは追加できるが削除はできない——これにより長期的な本番デプロイメントの後方互換性が保証される。
よくある質問
- AgentCore Memoryとは何で、何のために使われるか?
- AgentCore MemoryはAWSの完全マネージドサービスで、AIエージェントがエンティティごとに分離されたスペースに整理された情報を会話を通じて永続的に記憶できるようにする。
- メタデータフィルタリングは検索精度をどのように向上させるか?
- 属性フィルター(優先度、部署、時間範囲)がベクトル類似性検索の前に適用されることで、候補セットが絞り込まれ、意味的には類似していても無関係な結果がシグナルを汚染しなくなる。
- STRICTLY_CONSISTENTメタデータ抽出は何を保証するか?
- 管理者が入力した値がLLMの介入なしにそのまま伝播されるため、規制された環境での部署間または準拠レベル間の厳格な分離が保証される。