arXiv:2606.26649: Upute agentima pretvorene u formalno verificirani policy-as-code
Istraživači su razvili pipeline koji automatski prevodi prirodnojezične upute za AI agente, MCP opise alata i policy dokumente u formalno verificirani kod pomoću Cedar Policy Languagea i LLM generator-critic petlje, postižući znatno veću pokrivenost specifikacije nego ručno pisani simbolički enforcement.
Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.
Jaz između obećanja i jamstava
Većina današnjih sigurnosnih mjera za AI agente počiva na probabilističkim guardrailovima — sistemskim promptovima i fine-tuningom nametnuti ograničenjima bez formalnih garancija. Mondl, Maisel i Brock s tim se ne zadovoljavaju. Njihov rad, prihvaćen na AIWILD radionici na ICML 2026, uvodi automatizirani pipeline koji prirodnojezične policy dokumente, promptove i MCP opise alata prevodi u Cedar Policy Language — formalni jezik verificiranih pravila koji Amazon koristi za kontrolu pristupa u oblaku.
Kako radi generator-critic petlja?
LLM generator predlaže Cedar policy iz izvornog teksta, a drugi LLM critic provjerava pokrivenost i konzistentnost. Petlja se ponavlja dok politika ne zadovolji sve uvjete. Rezultat je strojno provjerljiv kod, a ne tekst koji agent može zanemariti.
Što pokazuju rezultati na MedAgentBench?
Na medicinskom agentu MedAgentBench autoformalizirane politike pokrile su znatno veći udio izvorne NL specifikacije nego ručno kodiran simbolički enforcement iz prethodnih radova. Konkretne postotke autori ne objavljuju u apstraktu, no kvalitativna razlika opisana je kao „substantially greater coverage” — a to je upravo točka kvara gdje ručni pristup otkazuje pri skaliranju na složenije domene.
Zašto je Cedar pravi izbor?
Cedar Policy Language dizajniran je za expresivnost i brzinu formalnog rezoniranja. Za razliku od Python skripti ili regex filtera, Cedar politike dopuštaju statičku analizu: možete dokazati da agent nikada neće pozvati određeni alat bez odgovarajuće autorizacije, bez pokretanja ijednog stvarnog poziva.
Česta pitanja
- Što je policy-as-code i zašto je važan za AI agente?
- Policy-as-code je pristup u kojemu se sigurnosna pravila zapisuju kao formalno verificirani programski kod umjesto prirodnojezičnih uputa. Za AI agente to znači da se ograničenja mogu matematički dokazati, a ne samo nadam da će ih model poštivati.
- Kako se autoformalizacija razlikuje od dosadašnjih guardrailova?
- Dosadašnji probabilistički guardrailovi (npr. sistemski prompt) nemaju formalna jamstva, a ručno pisani simbolički enforcement ne skalira. Ovaj pipeline kombinira LLM fleksibilnost s formalnom verifikacijom Cedar Policy Languagea.
Izvori
Povezane vijesti
arXiv:2606.26758: EGG — višeagentni okvir generira GPU kernele 2,13× brže od PyTorcha
AWS: Stripe pokrenuo 100+ AI agenata za financijsku usklađenost — lekcije iz produkcije
Anthropic: Claude Code v2.1.195 — onemogućavanje miša, poboljšan voice dictation i popravci hookova