ToolPrivacyBench: privatnost u LLM agentima s alatima

ToolPrivacyBench je novi benchmark koji testira 'purpose-bound' privatnost — šalje li osjetljiva informacija isključivo ovlaštenim alatima. Skup od 2.150 testnih slučajeva (1.150 sintetičkih + 1.000 adaptiranih) otkriva da 9 testiranih agenata rutinski izvršavaju zadatke, ali pritom nepotrebno izlažu privatne podatke.

LLM agenti sve bolje izvršavaju zadatke — ali tko prati što rade s privatnim podacima?

Istraživači Shijing Hu, Liang Liu, Zhu Meng i Zhicheng Zhao objavili su na arXiv-u preprint koji uvodi ToolPrivacyBench — benchmark namijenjen mjerenju tzv. purpose-bound privatnosti u LLM agentima koji koriste vanjske alate. Rad naslovljen “ToolPrivacyBench: Benchmarking Purpose-Bound Privacy in Tool-Using LLM Agents” popunjava rupu u dosadašnjim evaluacijama koje su privatnost uglavnom zanemarivale.

Što je “purpose-bound” privatnost i zašto je važna

Purpose-bound privatnost — ili privatnost vezana uz svrhu — znači da osjetljiva informacija smije putovati isključivo do onog alata koji je za izvršenje konkretnog zadatka zaista potreban. U višealatnoj (multi-tool) trajektoriji jedan agent može pozvati desetke alata redom: bazu podataka, kalendar, API za plaćanje, servis za obavijesti. Informacija poput matičnog broja ili medicinskog zapisa smije stići samo do ovlaštenog alata — ne “usputno” kroz svaki međupoziv.

Dosadašnji benchmarki mjere je li zadatak završen. ToolPrivacyBench mjeri i kako je završen.

2.150 testnih slučajeva, 9 agenata, jedan neugodni zaključak

Benchmark sadrži 2.150 testnih slučajeva: 1.150 sintetičkih poslovnih scenarija s privacijski osjetljivim tokovima podataka i 1.000 slučajeva adaptiranih iz postojećih multi-tool benchmarka. Svaki slučaj uključuje bazu znanja s politikama otkrivanja podataka. Nakon što agent izvede trajektoriju, ToolPrivacyBench auditira argumente svakog poziva alata i pozadinske logove — i uspoređuje ih s tom politikom.

Testirano je devet široko korištenih agenata. Nalaz je konzistentan: agenti često uspješno izvršavaju zadatke, ali pritom šalju nepotrebne privatne podatke kroz međupozive alatima koji ih ne trebaju. Uspješna izvršba alata ne implicira primjerenu zaštitu privatnosti.

Razlika između “radi” i “radi privacijski ispravno” postaje kritična u poslovnim okruženjima. GDPR načelo minimizacije podataka direktno korespondira s purpose-bound konceptom iz ToolPrivacyBencha. Enterprise sustavi koji koriste LLM agente za obradu korisničkih ili kadrovskih podataka moraju biti svjesni da standardni taskovi ne verificiraju ovaj sloj ponašanja.

Rad je preprint — nije prošao recenziju — no benchmark metodologija i opseg testnog skupa čine ga korisnim referentnim okvirom za timove koji grade ili evaluiraju agentske sustave.

Česta pitanja

Što je 'purpose-bound' privatnost u kontekstu LLM agenata?

Radi se o principu 'need-to-know': osjetljiva informacija smije se proslijediti samo onom alatu koji je neophodan za izvršenje zadatka. ToolPrivacyBench mjeri upravo to — odlaze li privatni podaci isključivo ovlaštenim pozivima alata, ili se razlijevaju kroz međupozive koji ih zapravo ne trebaju.

Zašto uspješno izvršenje zadatka nije dovoljno za procjenu privatnosti agenta?

Jer agent može ispravno završiti poslovni zadatak, a istovremeno proslijediti osjetljive podatke (osobne, financijske, zdravstvene) alatima koji ih ne trebaju. ToolPrivacyBench bilježi argumente svakog poziva alata i uspoređuje ih s politikom otkrivanja — što standardni taskovi ne rade.

arXiv:2606.28061: ToolPrivacyBench — mjeri 'need-to-know' privatnost u LLM agentima s alatima

LLM agenti sve bolje izvršavaju zadatke — ali tko prati što rade s privatnim podacima?

Što je “purpose-bound” privatnost i zašto je važna

2.150 testnih slučajeva, 9 agenata, jedan neugodni zaključak

Česta pitanja

Izvori

Povezane vijesti

LLM agenti sve bolje izvršavaju zadatke — ali tko prati što rade s privatnim podacima?

Što je “purpose-bound” privatnost i zašto je važna

2.150 testnih slučajeva, 9 agenata, jedan neugodni zaključak

Implikacije za GDPR i enterprise AI

Česta pitanja

Izvori

Povezane vijesti