🟡 🏥 实践应用 发布于: · 1 分钟阅读 ·

Anthropic:智能体编码研究 — 用户做出70%规划决策,Claude做出80%执行决策

编辑配图:编程中人类与AI智能体之间的决策分工

Anthropic发布了关于Claude Code智能体编码的经济研究。用户做出约70%的规划决策,而Claude承担约80%的执行决策。专家用户每次提示获得12个动作和3200个词,而初学者仅获得5个动作和600个词,验证任务成功率为28–33%对比15%。调试会话比例从2025年10月到2026年4月间从33%下降至19%,而平均任务价值增长约25%。

🤖

本文由人工智能基于一手来源生成。

Anthropic发布了关于Claude Code智能体编码的经济研究,量化了人类与AI智能体之间的工作分配。

用户和Claude之间如何分配决策?

研究显示,用户做出约70%的规划决策,而Claude承担约80%的执行决策。换句话说,人类保留战略方向(做什么和为什么),而智能体承担大部分操作执行(如何做)。这种分工是理解人类专业技能仍然关键以及智能体承担负担的框架。

专业技能对结果有多大影响?

专家和初学者之间的差异很大。专家用户每次提示获得12个动作和3200个词,而初学者仅获得5个动作和600个词——超过两倍。验证任务的成功率专家和中级用户为28–33%,而初学者为15%。值得注意的是,软件领域以外的工作者在26%的编码会话中取得成功,仅比软件工程师(30%)低4个百分点。

与智能体合作的工作性质如何变化?

在观察期间,调试会话比例从33%下降至19%(2025年10月至2026年4月),而”软件管理”比例从14%上升至21%。平均任务价值增长约25%。这一趋势显示从纠错转向编排,表明智能体正在承担越来越多的常规执行工作。

常见问题

用户和Claude之间如何分配决策?
用户做出约70%的规划决策,而Claude承担约80%的执行决策。
专家和初学者有多大差异?
专家每次提示获得12个动作和3200个词,而初学者仅获得5个动作和600个词,任务成功率为28–33%对比15%。