AI 에이전트, 형식적 정책 코드를 갖추다

연구자들이 AI 에이전트에 대한 자연어 지침, MCP 도구 설명, 정책 문서를 Cedar Policy Language와 LLM 생성기-비평가 루프를 사용하여 형식적으로 검증된 코드로 자동 번역하는 파이프라인을 개발했습니다. 수동으로 작성된 기호적 강제보다 훨씬 높은 사양 적용 범위를 달성합니다.

약속과 보장 사이의 간극

오늘날 AI 에이전트의 대부분의 보안 조치는 확률적 가드레일 — 형식적 보장 없이 시스템 프롬프트와 파인튜닝으로 부과된 제약 — 에 의존합니다. Mondl, Maisel, Brock은 이에 만족하지 않았습니다. ICML 2026의 AIWILD 워크숍에서 채택된 그들의 연구는 자연어 정책 문서, 프롬프트, MCP 도구 설명을 Amazon이 클라우드 접근 제어에 사용하는 형식적 검증 규칙 언어인 Cedar Policy Language로 번역하는 자동화된 파이프라인을 소개합니다.

생성기-비평가 루프는 어떻게 작동합니까?

LLM 생성기는 원본 텍스트에서 Cedar 정책을 제안하고, 두 번째 LLM 비평가가 적용 범위와 일관성을 확인합니다. 정책이 모든 조건을 만족할 때까지 루프가 반복됩니다. 결과는 에이전트가 무시할 수 있는 텍스트가 아닌 기계 검증 가능한 코드입니다.

MedAgentBench 결과는 무엇을 보여줍니까?

의료 에이전트 MedAgentBench에서 자동 형식화된 정책은 이전 연구의 수동으로 코딩된 기호적 강제보다 훨씬 더 많은 원본 NL 사양을 적용했습니다. 구체적인 수치는 초록에서 공개되지 않았지만, 정성적 차이는 “실질적으로 더 높은 적용 범위”로 설명됩니다 — 이는 수동 접근이 복잡한 도메인으로 확장될 때 실패하는 정확한 지점입니다.

Cedar가 올바른 선택인 이유

Cedar Policy Language는 표현력과 형식적 추론 속도를 위해 설계되었습니다. Python 스크립트나 정규식 필터와 달리, Cedar 정책은 정적 분석을 허용합니다: 실제 호출 없이도 에이전트가 적절한 권한 없이 특정 도구를 절대 호출하지 않을 것임을 증명할 수 있습니다.

자주 묻는 질문

정책 코드(policy-as-code)란 무엇이며 AI 에이전트에게 왜 중요합니까?

정책 코드는 보안 규칙을 자연어 지침 대신 형식적으로 검증된 프로그래밍 코드로 작성하는 접근 방식입니다. AI 에이전트에게 이는 모델이 규칙을 따르기를 바라는 것이 아니라 수학적으로 제약 조건을 증명할 수 있음을 의미합니다.

자동 형식화는 기존 가드레일과 어떻게 다릅니까?

기존의 확률적 가드레일(예: 시스템 프롬프트)은 형식적 보장이 없고, 수동으로 작성된 기호적 강제는 확장이 어렵습니다. 이 파이프라인은 LLM 유연성과 Cedar Policy Language의 형식적 검증을 결합합니다.

arXiv:2606.26649: AI 에이전트 지침을 형식적으로 검증된 정책 코드로 자동 변환

약속과 보장 사이의 간극

생성기-비평가 루프는 어떻게 작동합니까?

MedAgentBench 결과는 무엇을 보여줍니까?

Cedar가 올바른 선택인 이유

자주 묻는 질문

출처

관련 뉴스