专家和初学者有多大差异？

专家每次提示获得12个动作和3200个词，而初学者仅获得5个动作和600个词，任务成功率为28–33%对比15%。

Anthropic：智能体编码中谁在做决策

Anthropic发布了关于Claude Code智能体编码的经济研究。用户做出约70%的规划决策，而Claude承担约80%的执行决策。专家用户每次提示获得12个动作和3200个词，而初学者仅获得5个动作和600个词，验证任务成功率为28–33%对比15%。调试会话比例从2025年10月到2026年4月间从33%下降至19%，而平均任务价值增长约25%。

Anthropic发布了关于Claude Code智能体编码的经济研究，量化了人类与AI智能体之间的工作分配。

用户和Claude之间如何分配决策？

研究显示，用户做出约70%的规划决策，而Claude承担约80%的执行决策。换句话说，人类保留战略方向（做什么和为什么），而智能体承担大部分操作执行（如何做）。这种分工是理解人类专业技能仍然关键以及智能体承担负担的框架。

专业技能对结果有多大影响？

专家和初学者之间的差异很大。专家用户每次提示获得12个动作和3200个词，而初学者仅获得5个动作和600个词——超过两倍。验证任务的成功率专家和中级用户为28–33%，而初学者为15%。值得注意的是，软件领域以外的工作者在26%的编码会话中取得成功，仅比软件工程师（30%）低4个百分点。

与智能体合作的工作性质如何变化？

在观察期间，调试会话比例从33%下降至19%（2025年10月至2026年4月），而”软件管理”比例从14%上升至21%。平均任务价值增长约25%。这一趋势显示从纠错转向编排，表明智能体正在承担越来越多的常规执行工作。

Anthropic：智能体编码研究 — 用户做出70%规划决策，Claude做出80%执行决策

用户和Claude之间如何分配决策？

专业技能对结果有多大影响？

与智能体合作的工作性质如何变化？

常见问题

来源

相关新闻