ArXiv PASK: proaktivni AI agenti s long-term memorijom koji predviđaju namjere korisnika

Od reaktivnih do proaktivnih agenata

Većina današnjih AI agenata je reaktivna — čekaju da im korisnik kaže što da rade. PASK (Proactive Agent System with Knowledge) ide korak dalje: agent sam detektira što korisnik treba i predlaže akcije prije nego što korisnik mora postaviti pitanje.

Zamislite asistenta koji uoči da imate 3 sastanka u nizu i automatski pripremi sažetke svakog, predloži pauze za vodu, i naručio Uber za sljedeću lokaciju — sve bez da ste rekli ijednu riječ.

Kako PASK radi?

PASK implementira novi paradigm nazvan DD-MM-PAS:

1. Demand Detection (DD) — Detekcija potrebe

Koristi IntentFlow model za inferiranje latentnih korisničkih potreba
Analizira tekući kontekst (razgovor, kalendar, lokaciju, navike)
Identificira što bi korisnik vjerojatno SLJEDEĆE htio

2. Memory Modeling (MM) — Hibridna memorija

Workspace — kratkoročna trenutna sesija
User memory — dugoročno korisničko znanje (preference, navike)
Global memory — opće znanje o svijetu

3. Proactive Agent System (PAS) — Proaktivni sustav

Closed-loop infrastruktura koja kombinira detekciju i memoriju
Generira proaktivne akcije bez čekanja na upit

Performanse

Autori su izgradili LatentNeeds-Bench — benchmark od stvarnih korisničkih podataka. Njihov IntentFlow model:

Dostiže razinu Gemini 3 Flash modela pod identičnim latency ograničenjima
Identificira dublje korisničke namjere bolje od baseline modela
Funkcionira u real-time uvjetima za svakodnevnu primjenu

Zašto je ovo važno?

PASK direktno adresira praktične izazove koje prijašnja istraživanja u laboratorijskim uvjetima nisu adekvatno rješavala:

Dubina — razumijevanje suptilnih ili implicitnih potreba
Kompleksnost — kombiniranje više izvora konteksta
Dvosmislenost — handling scenarija gdje korisnik ne zna točno što hoće
Preciznost — izbjegavanje pogrešnih ili nametljivih sugestija
Real-time ograničenja — odgovor mora doći u ms, ne sekundama

Šire implikacije

Proaktivni agenti su sljedeća velika iteracija AI asistenata. Trenutni asistenti (Claude, ChatGPT, Gemini) su izvanredni reaktivno, ali korisnik mora znati ŠTO pitati. Proaktivni agenti smanjuju ovaj cognitive load — asistent sam predlaže.

Rizik je očit: previše proaktivnosti = nametljivost. PASK pokušava balansirati ovo kroz fini intent detection, ali konačni test bit će u stvarnoj primjeni.