arXiv:2606.26649: エージェントへの指示を形式検証済みのpolicy-as-codeに変換
研究者たちはAIエージェントへの自然言語指示・MCPツール説明・ポリシー文書をCedar Policy LanguageとLLMのgenerator-criticループを用いて形式検証済みコードへと自動変換するパイプラインを開発しました。従来の手書きシンボリックエンフォースメントより仕様カバレッジが大幅に向上しています。
この記事はAIにより一次情報源から生成されました。
約束と保証のギャップ
今日のAIエージェントに対するセキュリティ対策のほとんどは、確率的なガードレール——形式的な保証のないシステムプロンプトやファインチューニングによる制約——に依存しています。Mondl、Maisel、BrockはICML 2026のAIWILDワークショップに採択された研究でこれに甘んじません。彼らの研究は、自然言語のポリシー文書・プロンプト・MCPツール説明をCedar Policy Language——Amazonがクラウドのアクセス制御に使用する形式的な検証済みルール言語——に変換する自動パイプラインを導入しています。
generator-criticループはどのように機能するか?
LLMのgeneratorがソーステキストからCedarポリシーを提案し、別のLLMのcriticがカバレッジと一貫性を検証します。ループはすべての条件が満たされるまで繰り返されます。結果はエージェントが無視できるテキストではなく、機械的に検証可能なコードです。
MedAgentBenchでの結果
医療エージェントMedAgentBenchでは、自動形式化ポリシーが先行研究の手書きシンボリックエンフォースメントよりも元のNL仕様のカバレッジが大幅に向上しました。具体的なパーセンテージはアブストラクトでは公開されていませんが、質的な差異は「実質的に大きなカバレッジ」と説明されています——これは手動アプローチが複雑なドメインへのスケーリング時に失敗する正確なポイントです。
なぜCedarが適切な選択なのか?
Cedar Policy Languageは表現力と形式的推論の速度のために設計されています。PythonスクリプトやRegexフィルターとは異なり、Cedarポリシーは静的分析を可能にします——実際の呼び出しを一度も実行せずに、適切な認可なしに特定のツールを呼び出すことが絶対にないことを証明できます。
よくある質問
- policy-as-codeとは何ですか?AIエージェントにとってなぜ重要なのですか?
- policy-as-codeとは、セキュリティルールを自然言語の指示ではなく形式検証済みのプログラムコードとして記述するアプローチです。AIエージェントにとっては、制約を数学的に証明できるようになり、モデルが遵守してくれることへの期待に依存する必要がなくなります。
- 自動形式化は従来のガードレールとどう違いますか?
- 従来の確率的ガードレール(システムプロンプトなど)には形式的な保証がなく、手書きのシンボリックエンフォースメントはスケールしません。このパイプラインはLLMの柔軟性とCedar Policy Languageの形式検証を組み合わせています。