OECD AI: Kolektivna AI sigurnost zahtijeva G7 koordinaciju — prompt injection, agent sigurnost i model poisoning prioriteti
OECD AI je 21. svibnja 2026. objavio policy izvještaj autora de Rivoire, de Leusse, Seger i Butts koji argumentira da AI sigurnost zahtijeva međunarodnu koordinaciju jer prelazi okvire klasične kibernetske sigurnosti. Tri prioritetna područja su identificirana: obrana od prompt injection napada s reusable napadačkim metodama, sigurnost AI agenata koji autonomno pristupaju alatima i memoriji, te sprječavanje model poisoninga gdje mali broj zagađenih dokumenata može kompromitovati modele različitih veličina. Izvještaj preporučuje koordinaciju kroz G7 i OECD-GPAI mehanizme uz aktivnu javno-privatnu suradnju.
Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.
OECD AI Wonk publikacijski kanal objavio je 21. svibnja 2026. policy izvještaj autora Cyrus de Rivoire, Étienne de Leusse, Elizabeth Seger i Frederic Butts pod nazivom “Establishing the shared foundations for collective AI security”. Izvještaj je značajan jer dolazi kao službena OECD pozicija uoči G7 ministarskog sastanka i postavlja okvir za što bi koordinirani međunarodni odgovor na AI sigurnosne prijetnje trebao izgledati.
Zašto AI sigurnost prelazi okvir klasične kibernetske sigurnosti?
Autori OECD izvještaja argumentiraju da AI sustavi uvode kategorijski drugačije sigurnosne probleme nego klasični softver. Tri ključna razloga:
Prvo, reusable attack patterns — prompt injection napad koji djeluje na jedan model često se može prilagoditi za drugi model uz minimalni trošak. To je drastično drugačije od klasičnih exploit-a koji su typically vezani za specifičnu verziju softvera. Napadači tako dobivaju ekonomiju razmjera koja nije postojala u klasičnoj sigurnosti.
Drugo, agent autonomija — AI agenti samostalno pristupaju alatima, izvršavaju kod, čitaju i mijenjaju memoriju, te komuniciraju s vanjskim API-jevima. Klasični access control modeli (RBAC, ACL) nisu dizajnirani za autonomne aktere koji mogu kreativno kombinirati alate.
Treće, model poisoning na razini podataka — istraživanja iz 2025-2026 pokazuju da mali broj pažljivo oblikovanih dokumenata u trening korpusu može kompromitovati modele različitih veličina. To je supply chain attack vektor koji ne postoji u tradicionalnoj kibernetskoj sigurnosti na ovaj način.
Što OECD konkretno preporučuje?
Izvještaj preporučuje trostruki pristup:
-
Zajednički okvir za prijetnju — OECD-GPAI mehanizam za dijeljenje threat intelligence između država. Slično CERT/CSIRT modelu, ali specijaliziran za AI prijetnje (prompt injection kataloge, poznate poisoning vektore, novi agent escape patterns).
-
Standardizirani sigurnosni testovi — kroz NIST, ETSI i druge standard-setting tijela. Ideja je da se prompt injection robustness, agent isolation i data provenance verifikacija postanu testabilne metrike, slično kao što je TLS testing standardiziran kroz SSL Labs metodologiju.
-
Javno-privatna suradnja — formalni framework za suradnju između vlada (regulatori), industrije (oni koji grade modele i agente) i akademije (oni koji istražuju napade i obrane). G7 forum je predložen kao primarni koordinacijski mehanizam.
Što ovo znači u praksi za AI kompanije?
Za kompanije koje grade frontier modele (OpenAI, Anthropic, Google DeepMind), OECD pozicija sugerira da će regulatorni pritisak za dijeljenje threat data rasti. Pojedinačne kompanije više neće moći tretirati security issues kao confidential — postojat će formalna obveza disclosure prema drugim akterima u ekosustavu.
Za enterprise korisnike, izvještaj otvara pitanje agent governance — kako kontrolirati što AI agenti rade u korporativnim sustavima, koje alate smiju koristiti i kako logirati njihove akcije. Ovo se preklapa s nedavnim AISI izvještajem o teškoćama nadzora nad AI sustavima, čineći regulatornu sliku za 2026-2027 bitno aktivnijom nego što je bila prošle godine.
OECD izvještaj je policy dokument, ne tehnička specifikacija — ali postavlja agendu za nadolazeći G7 ministarski summit i bit će referenca u svim raspravama o globalnoj AI sigurnosti u sljedećih nekoliko mjeseci.
Česta pitanja
- Koja su tri prioriteta AI sigurnosti prema OECD izvještaju?
- Obrana od prompt injection napada, sigurnost AI agenata koji autonomno pristupaju alatima, te prevencija model poisoninga kroz zagađene podatke za treniranje.
- Zašto OECD smatra da AI sigurnost prelazi klasičnu kibernetsku sigurnost?
- Mali broj zagađenih dokumenata može kompromitovati AI modele različitih veličina, a reusable napadački obrasci dramatično smanjuju trošak napadima — ovo zahtijeva drugačiji obrambeni model nego klasični network security.
- Kroz koje mehanizme OECD predlaže koordinaciju?
- Kroz G7 forum i OECD-GPAI partnership, uz preporuku javno-privatne suradnje između vlada, akademije i industrije.
Povezane vijesti
Microsoft Research: Vega — ZK proofs za digitalni identitet, 92ms generiranje i 70% brži ponovljeni dokazi
GitHub: trovana VS Code ekstenzija probila ~3.800 internih repozitorija
arXiv:2605.18414: Promptovi ne štite — MCP proxy s ABAC-om postiže 0% neovlaštenih poziva alata