ArXiv: CIA otkriva kako se privatnost multi-agent sustava moze razbiti crnom kutijom
Zašto je bitno
Novi istrazivacki rad CIA (Communication Inference Attack) pokazuje da se komunikacijska topologija LLM multi-agent sustava moze rekonstruirati samo iz vanjskih upita, s tocnoscu od 87%+. Implikacije za sigurnost i privatnost AI sustava.
Istrazivacki tim predstavio je CIA (Communication Inference Attack), metodu koja omogucuje rekonstrukciju interne komunikacijske topologije LLM multi-agent sustava koristeci iskljucivo crnu kutiju — bez pristupa kodu, tezinama ili logovima.
Kako napad funkcionira
CIA saljuca pazljivo dizajnirane upite multi-agent sustavu i analizira odgovore. Iz obrazaca u odgovorima — brzine, sadrzaja, konzistentnosti — algoritam rekonstruira:
- Koji agenti komuniciraju medusobno
- Hijerarhiju donosenja odluka
- Tok informacija kroz sustav
Tocnost rekonstrukcije iznosi 0.87+ AUC (Area Under Curve), sto znaci da napadac moze s visokom pouzdanoscu mapirati internu arhitekturu sustava.
Sigurnosne implikacije
Poznavanje interne topologije multi-agent sustava omogucuje:
- Ciljane napade na najkritcnije agente u lancu
- Social engineering — manipulacija specificnih agenata koji imaju utjecaj na odluke
- Kraduinteligencije — rekonstrukcija poslovne logike iz arhitekture sustava
Zasto je vazno
Kako poduzeca sve vise koriste multi-agent sustave za kriticne poslovne procese, ovaj rad upozorava da sama arhitektura postaje ranjivost — cak i bez pristupa kodu ili podacima, napadac moze razumjeti kako sustav funkcionira iznutra.
Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.
Povezane vijesti
OpenAI nudi 25.000 dolara za pronalazak univerzalnih jailbreakova biološke sigurnosti GPT-5.5
GPT-5.5 System Card: OpenAI objavljuje sigurnosne evaluacije i procjenu rizika novog modela
OpenAI objavio Privacy Filter: open-weight model za detekciju i redakciju osobnih podataka