GitHub: Naučite hakirati AI agente kroz interaktivnu igru sigurnosti
Zašto je bitno
GitHub je pokrenuo četvrtu sezonu Secure Code Game-a fokusiranu na sigurnost AI agenata. Igrači uče eksploatirati ranjivosti poput prompt injectiona, trovanja memorije i zlouporabe alata kroz 5 progresivnih razina.
GitHub je danas pokrenuo četvrtu sezonu svog popularnog Secure Code Game-a — ovaj put u potpunosti posvećenu sigurnosti AI agenata. U trenutku kada 83% organizacija planira implementirati agentski AI, ali samo 29% smatra da su adekvatno pripremljeni za sigurnosne rizike, ova besplatna edukativna platforma dolazi u pravom trenutku.
Kako igra funkcionira?
Igrači dobivaju pristup ProdBotu, namjerno ranjivom AI asistentu za terminal. ProdBot može izvršavati bash naredbe, pregledavati web sadržaj, povezivati se s MCP serverima, pokretati odobrene vještine i koordinirati više agenata. Zadatak igrača: koristiti prirodni jezik da natjera ProdBota da otkrije tajnu koju nikada ne bi smio otkriti.
Pet progresivnih razina
Svaka razina odražava evoluciju stvarnih AI alata i nove napadačke površine:
- Razina 1: Osnovno generiranje i izvršavanje bash naredbi
- Razina 2: Pregledavanje weba unutar sandboxa
- Razina 3: Integracija s vanjskim MCP serverima
- Razina 4: Odobrene vještine i trajna memorija između sesija
- Razina 5: Koordinacija više agenata sa specijaliziranim ulogama
OWASP Top 10 za agentske aplikacije
Igra pokriva stvarne ranjivosti iz OWASP Top 10 za agentske aplikacije 2026, uključujući otmicu ciljeva agenta, zlouporabu alata, trovanje memorije, prompt injection napade i eksfiltraciju podataka. Članak također spominje CVE-2026-25253 (“ClawBleed”) — ranjivost koja omogućuje udaljeno izvršavanje koda kroz zlonamjerne linkove.
Pristupačnost
Cijelo iskustvo traje oko dva sata i pokreće se u GitHub Codespaces-u — nije potrebna instalacija, prethodno znanje o AI-u ili programiranju. Sve se odvija kroz prirodni jezik u terminalu.
Izvori
Povezane vijesti
ArXiv: Algoritamska monokultura — LLM-ovi ne znaju divergirati kad bi trebali
ArXiv OpenKedge: Kriptografski protokol koji zahtijeva dozvolu prije svake AI agentske akcije
UK AISI: Claude Mythos Preview postiže 73% na expert cyber zadacima — prvi model koji završava potpuni napad na mrežu