ArXiv PASK:ユーザーの意図を予測する長期記憶を持つプロアクティブAIエージェント
なぜ重要か
新しい論文PASKは、意図検出、ハイブリッドメモリ、自己主導のアクションを組み合わせたプロアクティブAIエージェントのフレームワークを提示します。IntentFlowモデルは、潜在的なユーザーニーズの認識において主要なGemini 3 Flashモデルのレベルに達しました。
リアクティブからプロアクティブなエージェントへ
今日のAIエージェントの大部分は リアクティブ です。ユーザーが何をすべきかを伝えるのを待っています。PASK(Proactive Agent System with Knowledge)はさらに一歩進んでいます。エージェント自身が ユーザーが何を必要としているかを検出 し、ユーザーが質問をしなければならない前にアクションを提案します。
3つの会議が連続していることに気付き、それぞれの要約を自動的に準備し、水分補給の休憩を提案し、次の場所へのUberを注文するアシスタントを想像してみてください。すべてあなたが一言も言わずに、です。
PASKはどのように機能しますか?
PASKは DD-MM-PAS と呼ばれる新しいパラダイムを実装しています。
1. Demand Detection(DD)— ニーズの検出
- IntentFlowモデル を使用して潜在的なユーザーニーズを推論
- 現在のコンテキスト(会話、カレンダー、場所、習慣)を分析
- ユーザーが次に何を望むかを特定
2. Memory Modeling(MM)— ハイブリッドメモリ
- Workspace — 短期の現在のセッション
- User memory — 長期のユーザー知識(好み、習慣)
- Global memory — 世界についての一般的な知識
3. Proactive Agent System(PAS)— プロアクティブシステム
- 検出とメモリを組み合わせた閉ループインフラストラクチャ
- クエリを待たずにプロアクティブなアクションを生成
パフォーマンス
著者たちは LatentNeeds-Bench を構築しました。これは実際のユーザーデータからのベンチマークです。彼らのIntentFlowモデルは:
- 同一のレイテンシ制約下でGemini 3 Flashモデルのレベルに到達
- ベースラインモデルよりも深いユーザー意図を識別
- 日常的な使用のために リアルタイム条件で機能
なぜこれが重要なのでしょうか?
PASKは、以前の実験室研究では適切に対処されていなかった実践的な課題に直接取り組んでいます。
- 深さ — 微妙または暗黙的なニーズを理解する
- 複雑さ — 複数のコンテキストソースを組み合わせる
- 曖昧さ — ユーザーが正確に何を望んでいるか分からないシナリオの処理
- 精度 — 誤ったまたは侵入的な提案を避ける
- リアルタイムの制約 — 応答は秒ではなくミリ秒で届く必要があります
より広範な影響
プロアクティブなエージェントは、AIアシスタントの次の大きなイテレーションです。現在のアシスタント(Claude、ChatGPT、Gemini)はリアクティブには優れていますが、ユーザーは 何を尋ねるべきか を知っている必要があります。プロアクティブなエージェントはこの認知的負荷を軽減します。アシスタント自身が提案するのです。
リスクは明らかです:プロアクティブすぎる = 侵入的。PASKはこれを細かい意図検出を通じてバランスしようとしますが、最終的なテストは実際の使用にあります。