ArXiv PASK: proaktive KI-Agenten mit Langzeitgedächtnis, die Nutzerabsichten vorhersagen

Von reaktiven zu proaktiven Agenten

Die meisten heutigen KI-Agenten sind reaktiv — sie warten darauf, dass der Nutzer ihnen sagt, was sie tun sollen. PASK (Proactive Agent System with Knowledge) geht einen Schritt weiter: Der Agent erkennt selbst, was der Nutzer benötigt, und schlägt Aktionen vor, bevor der Nutzer überhaupt fragen muss.

Stellen Sie sich einen Assistenten vor, der bemerkt, dass Sie drei Besprechungen hintereinander haben, und automatisch Zusammenfassungen jeder einzelnen erstellt, Wasserpausen vorschlägt und einen Uber für den nächsten Standort bestellt — und das alles, ohne dass Sie ein einziges Wort sagen.

Wie funktioniert PASK?

PASK implementiert ein neues Paradigma namens DD-MM-PAS:

1. Demand Detection (DD) — Bedarfserkennung

Nutzt das IntentFlow-Modell, um latente Nutzerbedürfnisse abzuleiten
Analysiert den aktuellen Kontext (Gespräch, Kalender, Standort, Gewohnheiten)
Identifiziert, was der Nutzer ALS NÄCHSTES wahrscheinlich möchte

2. Memory Modeling (MM) — Hybrides Gedächtnis

Workspace — kurzfristige aktuelle Sitzung
User memory — langfristiges Nutzerwissen (Präferenzen, Gewohnheiten)
Global memory — allgemeines Wissen über die Welt

3. Proactive Agent System (PAS) — Proaktives System

Closed-Loop-Infrastruktur, die Erkennung und Gedächtnis kombiniert
Generiert proaktive Aktionen, ohne auf eine Anfrage zu warten

Performance

Die Autoren haben LatentNeeds-Bench entwickelt — einen Benchmark aus echten Nutzerdaten. Ihr IntentFlow-Modell:

Erreicht das Niveau der Gemini-3-Flash-Modelle unter identischen Latenzbedingungen
Identifiziert tiefere Nutzerabsichten besser als Baseline-Modelle
Funktioniert in Echtzeitbedingungen für den täglichen Gebrauch

Warum ist das wichtig?

PASK adressiert direkt praktische Herausforderungen, die frühere Forschung unter Laborbedingungen nicht adäquat gelöst hat:

Tiefe — das Verständnis subtiler oder impliziter Bedürfnisse
Komplexität — das Kombinieren mehrerer Kontextquellen
Mehrdeutigkeit — der Umgang mit Szenarien, in denen der Nutzer nicht genau weiß, was er möchte
Präzision — das Vermeiden falscher oder aufdringlicher Vorschläge
Echtzeitbeschränkungen — die Antwort muss in Millisekunden kommen, nicht in Sekunden

Weitreichende Implikationen

Proaktive Agenten sind die nächste große Iteration von KI-Assistenten. Aktuelle Assistenten (Claude, ChatGPT, Gemini) sind im reaktiven Modus hervorragend, aber der Nutzer muss wissen, WAS er fragen soll. Proaktive Agenten reduzieren diese kognitive Belastung — der Assistent schlägt selbst etwas vor.

Das Risiko liegt auf der Hand: Zu viel Proaktivität = Aufdringlichkeit. PASK versucht, dies durch feinkörnige Absichtserkennung auszubalancieren, aber der eigentliche Test wird in der realen Anwendung erfolgen.