ArXiv PASK: proaktivni AI agenti s long-term memorijom koji predviđaju namjere korisnika
Zašto je bitno
Novi rad PASK predstavlja okvir za proaktivne AI agente koji kombiniraju detekciju namjera, hibridnu memoriju i samoinicijativnu akciju. IntentFlow model dosegao je razinu vodećih Gemini 3 Flash modela u prepoznavanju latentnih korisničkih potreba.
Od reaktivnih do proaktivnih agenata
Većina današnjih AI agenata je reaktivna — čekaju da im korisnik kaže što da rade. PASK (Proactive Agent System with Knowledge) ide korak dalje: agent sam detektira što korisnik treba i predlaže akcije prije nego što korisnik mora postaviti pitanje.
Zamislite asistenta koji uoči da imate 3 sastanka u nizu i automatski pripremi sažetke svakog, predloži pauze za vodu, i naručio Uber za sljedeću lokaciju — sve bez da ste rekli ijednu riječ.
Kako PASK radi?
PASK implementira novi paradigm nazvan DD-MM-PAS:
1. Demand Detection (DD) — Detekcija potrebe
- Koristi IntentFlow model za inferiranje latentnih korisničkih potreba
- Analizira tekući kontekst (razgovor, kalendar, lokaciju, navike)
- Identificira što bi korisnik vjerojatno SLJEDEĆE htio
2. Memory Modeling (MM) — Hibridna memorija
- Workspace — kratkoročna trenutna sesija
- User memory — dugoročno korisničko znanje (preference, navike)
- Global memory — opće znanje o svijetu
3. Proactive Agent System (PAS) — Proaktivni sustav
- Closed-loop infrastruktura koja kombinira detekciju i memoriju
- Generira proaktivne akcije bez čekanja na upit
Performanse
Autori su izgradili LatentNeeds-Bench — benchmark od stvarnih korisničkih podataka. Njihov IntentFlow model:
- Dostiže razinu Gemini 3 Flash modela pod identičnim latency ograničenjima
- Identificira dublje korisničke namjere bolje od baseline modela
- Funkcionira u real-time uvjetima za svakodnevnu primjenu
Zašto je ovo važno?
PASK direktno adresira praktične izazove koje prijašnja istraživanja u laboratorijskim uvjetima nisu adekvatno rješavala:
- Dubina — razumijevanje suptilnih ili implicitnih potreba
- Kompleksnost — kombiniranje više izvora konteksta
- Dvosmislenost — handling scenarija gdje korisnik ne zna točno što hoće
- Preciznost — izbjegavanje pogrešnih ili nametljivih sugestija
- Real-time ograničenja — odgovor mora doći u ms, ne sekundama
Šire implikacije
Proaktivni agenti su sljedeća velika iteracija AI asistenata. Trenutni asistenti (Claude, ChatGPT, Gemini) su izvanredni reaktivno, ali korisnik mora znati ŠTO pitati. Proaktivni agenti smanjuju ovaj cognitive load — asistent sam predlaže.
Rizik je očit: previše proaktivnosti = nametljivost. PASK pokušava balansirati ovo kroz fini intent detection, ali konačni test bit će u stvarnoj primjeni.