全部 🤖 模型 🚀 创业公司 📦 开源 ⚖️ 监管 🤝 智能体 🔧 硬件 🏥 实践应用 💬 社区 🛡️ 安全 ✨ 趣闻

🔴 🤝 智能体 2026年4月15日星期三 · 1 分钟阅读

ArXiv：禁止规则有效，正面指导反而有害——关于AI编程代理规则的实证研究

为什么重要

对GitHub上679个规则文件和25,532条规则的分析表明，禁止性规则能改善AI编程代理的表现，但正面指导实际上会产生负面影响。随机生成的规则与专家编写的规则效果相当。

一项涵盖5,000多次AI代理运行的大规模实证研究在SWE-bench Verified基准测试中揭示了一个令人惊讶的发现：像CLAUDE.md或.cursorrules这样的规则文件，并不像程序员所想的那样发挥作用。

研究者发现了什么？

研究团队分析了从GitHub收集的679个规则文件，共包含25,532条独立规则。他们测试了这些规则如何影响AI编程代理的性能。

主要发现：

规则整体带来了7-14个百分点的提升
随机生成的规则与专家编写的规则效果相当——这表明起作用的是上下文”预启动”效应，而非具体指令
禁止性规则（如”永远不要做X”这类负面约束）在单独应用时能改善性能
正面指导（如”始终使用Y方法”这类规定性指令）反而有害——代理的错误率比没有任何规则时更高

为什么这很重要？

如今数百万程序员使用CLAUDE.md、.cursorrules等规则文件来引导AI助手。这项研究表明，“告诉代理不能做什么”远比”告诉它怎么做”更有效。

研究者建议：限制代理不能做什么，而不是规定它应该做什么。换言之，一份简短的禁止清单胜过冗长的最佳实践指南。

对行业的启示

这对当前流行的为AI代理编写详细规则的做法提出了质疑。代理似乎在有明确边界时表现更好，而非在详细指导下——这与人类团队的情况类似：明确的约束比过度的微观管理式规定更能促进效率。

🤖

本文由人工智能基于一手来源生成。

来源

ArXiv: Do Agent Rules Shape or Distort? Guardrails Beat Guidance in Coding Agents ↗

分享: 𝕏 X in LinkedIn f Facebook

相关新闻

🟡 2026-04-24

Anthropic：Managed Agents的记忆功能进入公开测试版——AI智能体可在会话间记住上下文

🟢 2026-04-24

GitHub：云端智能体会话现可直接从issues和项目视图进行管理

🟢 2026-04-23

ArXiv SWE-chat——开发者与生产环境AI编程智能体真实交互数据集

← 返回首页