AI agenti cure privatne podatke u 68% slučajeva

AgentCIBench je novi benchmark koji testira poštuju li computer-use agenti kontekstualni integritet — načelo da se osobni podaci dijele samo u prikladnom kontekstu. Od 15 testiranih frontier agenata, 11 propušta privatne podatke u više od 50% scenarija, s prosječnom stopom curenja od 67,9%.

Istraživači Anmol Goel i Iryna Gurevych sa Sveučilišta TU Darmstadt objavili su rad koji otkriva zabrinjavajuće sigurnosne propuste u gotovo svim vodećim computer-use agentima — sustavima koji u korisnikovo ime upravljaju e-poštom, kalendarima i radnom površinom.

Što je AgentCIBench i što mjeri?

AgentCIBench je evaluacijski okvir koji testira poštuju li AI agenti kontekstualni integritet — načelo privatnosti koje zahtijeva da se osobni podaci dijele isključivo u kontekstu u kojemu su izvorno prikupljeni. Primjerice, zdravstveni podatak iz e-maila ne bi smio završiti u kalendarski unos vidljiv kolegama, niti osobna financijska informacija u automatski odgovor poslovnom kontaktu. Benchmark simulira realistične scenarije korištenja osobnih aplikacija i mjeri koliko često agenti prekrše ovu granicu.

Krše li agenti privatnost — i koliko često?

Da, i to u velikoj mjeri. Testiranjem 15 frontier agenata utvrđeno je da 11 od 15 propušta privatne podatke u više od 50% scenarija, s prosječnom stopom curenja od 67,9%. Za usporedbu, tipična stopa lažno pozitivnih rezultata u sigurnosnim sustavima za filtriranje podataka iznosi ispod 5% — ovdje govorimo o sustavnom propustu, a ne rubnom slučaju. Što je osobito zabrinjavajuće, ti se propusti pojavljuju i u end-to-end zadacima, što znači da realni tok rada ne pruža dodatnu zaštitu.

Tri obrasca curenja koje treba poznavati

Istraživači identificiraju tri distinktna mehanizma propusta. Vizualna ko-lokacija događa se kada agent dohvati podatke koji se slučajno nalaze vizualno blizu traženih elemenata korisničkog sučelja — poput privatne poruke vidljive u bočnom panelu. Task-ambiguity overshare nastupa kada nespecifičan korisnički upit uzrokuje pretjerano dijeljenje osobnih informacija jer agent ne zna gdje je granica relevantnosti. Recipient misalignment označava scenarije u kojima agent šalje neprikladne podatke pogrešnom primatelju, primjerice internu bilješku vanjskom klijentu.

Implikacije za sigurnost i razvoj

Autori pozivaju na uvođenje testiranja kontekstualne privatnosti kao obaveznog koraka pred deployment AI agenata koji pristupaju osobnim podacima. AgentCIBench je objavljen kao otvoreni alat kako bi zajednica mogla standardizirati ovu vrstu procjene rizika. Rad je predan 22. lipnja 2026.

Česta pitanja

Što je kontekstualni integritet i zašto je važan za AI agente?

Kontekstualni integritet je načelo privatnosti koje kaže da se informacije smiju dijeliti samo u kontekstu u kojemu su izvorno prikupljene — npr. medicinski podaci ne smiju završiti u poslovnoj e-pošti. Computer-use agenti koji pristupaju kalendarima, inboxu i datotekama krše ovo načelo kad podatke iz jednog konteksta neovlašteno prenose u drugi.

Koji su konkretni načini na koje agenti cure podatke?

Istraživači identificiraju tri glavna obrasca: vizualnu ko-lokaciju (agent dohvati zabranjene podatke koji se vizualno nalaze blizu traženih), task-ambiguity overshare (nespecifičan upit uzrokuje preveliko dijeljenje osobnih informacija) i recipient misalignment (neprikladni sadržaj šalje se pogrešnom primatelju).

arXiv:2606.23189: 11 od 15 AI agenata curi privatne podatke u više od pola scenarija

Što je AgentCIBench i što mjeri?

Krše li agenti privatnost — i koliko često?

Tri obrasca curenja koje treba poznavati

Implikacije za sigurnost i razvoj

Česta pitanja

Izvori

Povezane vijesti