🟡 🏥 実践 公開日: · 2 分で読めます ·

Anthropic:エージェントコーディング研究 — ユーザーが計画の70%、Claudeが実行の80%を担う

編集用イラスト:プログラミングにおける人間とAIエージェント間の意思決定の分担

AnthropicはClaude Codeによるエージェントコーディングに関する経済研究を発表しました。ユーザーは計画に関する意思決定の約70%を行い、Claudeは実行に関する意思決定の約80%を担います。専門ユーザーはプロンプトごとに12アクションと3200語を得るのに対し、初心者は5アクションと600語で、検証済みタスクの成功率は28〜33%対15%です。デバッグセッションの割合は2025年10月から2026年4月にかけて33%から19%に低下し、平均タスク価値は約25%上昇しました。

🤖

この記事はAIにより一次情報源から生成されました。

Anthropicはエージェントコーディングに関する経済研究をClaude Codeで公表し、人間とAIエージェント間の作業分担を定量化しました。

ユーザーとClaudeの間でどのように意思決定が分担されますか?

研究によると、ユーザーは約70%の計画に関する意思決定を行い、Claudeは約80%の実行に関する意思決定を担います。言い換えれば、人間は戦略的方向性(何を、なぜ)を保持し、エージェントが運用上の実行(どのように)の大部分を担います。この分業は、人間の専門知識が依然として重要な部分とエージェントが負担を担う部分を理解するための枠組みです。

専門知識は結果にどれくらい影響しますか?

専門家と初心者の差は大きいです。専門ユーザーはプロンプトごとに12アクションと3200語を得るのに対し、初心者は5アクションと600語——2倍以上の差があります。検証済みタスクの成功率は専門家・中級ユーザーで28〜33%、初心者では15%です。興味深いことに、ソフトウェア以外の分野の作業者はコーディングセッションの26%で成功しており、ソフトウェアエンジニア(30%)とわずか4ポイントの差しかありません。

エージェントとの作業の性質はどのように変わっていますか?

観察期間中、デバッグセッションの割合は33%から19%に低下し(2025年10月〜2026年4月)、「ソフトウェア管理」の割合は14%から21%に上昇しました。平均タスク価値は約25%上昇しました。このトレンドはデバッグから調整へのシフトを示しており、エージェントが定常的な実行作業の大部分を担いつつあることを示唆しています。

よくある質問

ユーザーとClaudeの間でどのように意思決定が分担されますか?
ユーザーは計画に関する意思決定の約70%を行い、Claudeは実行に関する意思決定の約80%を担います。
専門家と初心者ではどれくらい違いがありますか?
専門家はプロンプトごとに12アクションと3200語を得るのに対し、初心者は5アクションと600語で、タスク成功率は28〜33%対15%です。