AI agenti dobivaju formalni policy-as-code

Istraživači su razvili pipeline koji automatski prevodi prirodnojezične upute za AI agente, MCP opise alata i policy dokumente u formalno verificirani kod pomoću Cedar Policy Languagea i LLM generator-critic petlje, postižući znatno veću pokrivenost specifikacije nego ručno pisani simbolički enforcement.

Jaz između obećanja i jamstava

Većina današnjih sigurnosnih mjera za AI agente počiva na probabilističkim guardrailovima — sistemskim promptovima i fine-tuningom nametnuti ograničenjima bez formalnih garancija. Mondl, Maisel i Brock s tim se ne zadovoljavaju. Njihov rad, prihvaćen na AIWILD radionici na ICML 2026, uvodi automatizirani pipeline koji prirodnojezične policy dokumente, promptove i MCP opise alata prevodi u Cedar Policy Language — formalni jezik verificiranih pravila koji Amazon koristi za kontrolu pristupa u oblaku.

Kako radi generator-critic petlja?

LLM generator predlaže Cedar policy iz izvornog teksta, a drugi LLM critic provjerava pokrivenost i konzistentnost. Petlja se ponavlja dok politika ne zadovolji sve uvjete. Rezultat je strojno provjerljiv kod, a ne tekst koji agent može zanemariti.

Što pokazuju rezultati na MedAgentBench?

Na medicinskom agentu MedAgentBench autoformalizirane politike pokrile su znatno veći udio izvorne NL specifikacije nego ručno kodiran simbolički enforcement iz prethodnih radova. Konkretne postotke autori ne objavljuju u apstraktu, no kvalitativna razlika opisana je kao „substantially greater coverage” — a to je upravo točka kvara gdje ručni pristup otkazuje pri skaliranju na složenije domene.

Zašto je Cedar pravi izbor?

Cedar Policy Language dizajniran je za expresivnost i brzinu formalnog rezoniranja. Za razliku od Python skripti ili regex filtera, Cedar politike dopuštaju statičku analizu: možete dokazati da agent nikada neće pozvati određeni alat bez odgovarajuće autorizacije, bez pokretanja ijednog stvarnog poziva.

Česta pitanja

Što je policy-as-code i zašto je važan za AI agente?

Policy-as-code je pristup u kojemu se sigurnosna pravila zapisuju kao formalno verificirani programski kod umjesto prirodnojezičnih uputa. Za AI agente to znači da se ograničenja mogu matematički dokazati, a ne samo nadam da će ih model poštivati.

Kako se autoformalizacija razlikuje od dosadašnjih guardrailova?

Dosadašnji probabilistički guardrailovi (npr. sistemski prompt) nemaju formalna jamstva, a ručno pisani simbolički enforcement ne skalira. Ovaj pipeline kombinira LLM fleksibilnost s formalnom verifikacijom Cedar Policy Languagea.

arXiv:2606.26649: Upute agentima pretvorene u formalno verificirani policy-as-code

Jaz između obećanja i jamstava

Kako radi generator-critic petlja?

Što pokazuju rezultati na MedAgentBench?

Zašto je Cedar pravi izbor?

Česta pitanja

Izvori

Povezane vijesti