Anthropic:Project Fetch第2フェーズ——ロボット作業が20倍高速化、コード量10倍削減
Claude Opus 4.7が商用四足ロボットを自律制御し、人間チームと比較して約20倍速くタスクを完了しました。また、同等以上の成果を上げながら記述コード量は約10倍少なく、精密なクローズドループ制御のみが依然として課題として残っています。
この記事はAIにより一次情報源から生成されました。
Anthropicは、Project Fetch研究プロジェクトの第2フェーズの成果を発表しました。このフェーズでは、Claude Opus 4.7モデルが商用四足ロボット——4本の足で歩く自律型ロボット——を制御し、標準化されたタスクセットをこなしました。この実験は、最先進のClaudeモデルの境界能力と安全上の限界を検証する専門チームであるFrontier Red Teamの活動の一環です。
結果:20倍の高速化と10倍のコード削減
Opus 4.7は、AIアシスタンスなしで作業した最速の人間チームと比較して約20倍速くタスクを完了し、AIツールをサポートとして使用したチームと比較しても約19倍速く完了しました。4つの比較タスクにおいて、モデルが生成したコードは約1,045行にとどまりましたが、人間チームが同じ結果を出すために10,309行を記述していました——ほぼ10倍の差です。出力品質はモデルが同等以上でした。
技術的背景
この実験は、能力の真の、台本なしの検証として設計されました。Opus 4.7は事前定義された動作シーケンスを持たず、リアルタイムでロボットシステムへの命令を計画・実行しました。四足動物はテストのために改造されていない標準的な商用仕様であり、これにより市販ハードウェアへの知見の適用可能性がさらに確認されました。AIアシスト人間チームとの比較(Opus 4.7より19倍遅い)は文脈化に重要です。ツールを使っても、チームは実行速度において自律モデルに匹敵できません。
能力の限界と安全面
印象的な結果にもかかわらず、Frontier Red Teamは明確な限界を特定しました。精密なクローズドループ制御——リアルタイムのフィードバックに基づいて動作を継続的に調整する能力——は依然としてOpus 4.7の能力を超えています。具体的には、ボールの自律的なキャッチが信頼性をもって実行できないことが示されました。この限界は技術的なものだけでなく、安全上の意味も持ちます。精密な物理的操作は、リスクの高い複数の用途の前提条件です。Frontier Red Teamは、このような限界は研究方法論の不可欠な部分であり、偶発的な欠陥ではないと強調しています。
業界への影響
Project Fetch第2フェーズは、自律AI ロボティクスの測定可能なベンチマークを打ち立てました。20倍の高速化と10倍のコード削減は、標準化されたタスクセットで計測された結果であり、逸話ではありません。産業応用にとっては、開発・統合サイクルが劇的に短縮される可能性を意味します。Anthropicは本番展開の日程やロボティクス関連の商業計画を発表しておらず、発見を研究段階の成果として扱っています。Project FetchはFrontier Red Teamプログラムの枠内にとどまっています。
よくある質問
- Project Fetchとは何ですか?またその目的は?
- Project Fetchは、AnthropicのFrontier Red Teamの研究イニシアチブであり、商用四足ロボットを使った自律タスクにClaudeモデルを適用することで、AIによるロボティクスの可能性と安全性を評価します。
- なぜClaude Opus 4.7はそれほど少ないコードで同じ成果を達成できたのですか?
- Opus 4.7はより高いレベルの抽象化とコンパクトなアルゴリズムパターンを活用します。人間チームが10,309行のコードを要したタスクを、モデルは約1,045行で同等以上の結果を達成しており、問題解決に対する構造的に異なるアプローチを示しています。