🔴 🤝 智能体 发布于: · 2 分钟阅读 ·

Anthropic:Project Fetch第二阶段——机器人作业速度提升20倍,代码量减少10倍

编辑插图:Project Fetch第二阶段——机器人作业速度提升20倍,代码量减少10倍

Claude Opus 4.7自主控制机器人四足动物,完成任务的速度比人类团队快20倍,且编写的代码量约减少10倍,同时达到同等甚至更优的效果。然而,精确的闭环控制仍是一大挑战。

🤖

本文由人工智能基于一手来源生成。

Anthropic发布了Project Fetch研究项目第二阶段的成果。在本阶段中,Claude Opus 4.7模型控制一台商用四足机器人——一种以四条腿行走的自主机器人——在一系列标准化任务上接受测试。该实验是前沿红队工作的组成部分,这一专业团队专门检验最先进Claude模型的边界能力与安全限制。

成果:速度提升20倍,代码量减少10倍

Opus 4.7完成任务的速度约比未使用AI辅助的最快人类团队快20倍,约比使用AI工具辅助的团队快19倍。在四个可比任务上,模型仅生成了约1,045行代码,而人类团队完成相同结果写了10,309行——几乎是模型的十倍。输出质量与模型持平或优于人类。

技术背景

该实验被设计为真实、无脚本的能力检验:Opus 4.7没有预定义的动作序列,而是实时规划并执行机器人系统的指令。所用四足动物为标准商用规格,未针对测试需求进行定制,这进一步证实了研究结论对现成硬件的适用性。与AI辅助人类团队(比Opus 4.7慢19倍)的对比是关键背景:即便借助工具,团队也无法在执行速度上与自主模型相提并论。

能力边界与安全考量

尽管成果令人印象深刻,前沿红队识别出一个明确的局限:精确闭环控制——根据实时反馈持续调整动作的能力——仍超出Opus 4.7的能力范围。具体而言,自主抓球被证明无法可靠完成。这一局限不仅具有技术意义,也具有安全意义:精确的物理操控是多种高风险应用场景的前提条件。前沿红队强调,这类局限是研究方法论的有机组成部分,而非偶然疏漏。

对行业的意义

Project Fetch第二阶段为自主AI机器人技术树立了可量化的参照标准:速度提升20倍、代码量减少10倍不是趣闻式的结果,而是在标准化任务集上的实测数据。对于工业应用而言,这意味着开发和集成周期有望大幅缩短。Anthropic尚未公布机器人技术的生产部署日期或商业计划;现阶段将研究结论定性为学术性成果,Project Fetch仍完全在前沿红队项目框架内开展。

常见问题

Project Fetch是什么,其目的是什么?
Project Fetch是Anthropic前沿红队(Frontier Red Team)的研究计划,通过让Claude模型在商用四足机器人上完成自主任务,测量AI驱动机器人技术的潜力与安全性。
Claude Opus 4.7为何能写出少得多的代码?
Opus 4.7采用更高层次的抽象与更紧凑的算法模式;人类团队完成相同任务写了10,309行代码,而模型仅用约1,045行便达到相同或更优的效果,体现了结构性不同的问题解决思路。