Anthropic: Project Fetch Phase 2 — 20× schnellerer Roboterbetrieb mit 10× weniger Code
Claude Opus 4.7 steuerte autonom einen Roboter-Quadrupeden und erledigte Aufgaben 20× schneller als ein menschliches Team bei ~10× weniger Code mit gleich guten oder besseren Ergebnissen. Präzise Closed-Loop-Steuerung bleibt jedoch eine Herausforderung.
Dieser Artikel wurde mithilfe von künstlicher Intelligenz aus Primärquellen erstellt.
Anthropic hat die Ergebnisse der zweiten Phase des Forschungsprojekts Project Fetch veröffentlicht. Darin steuerte Claude Opus 4.7 einen kommerziellen Roboter-Quadrupeden — einen autonomen vierläufigen Laufroboter — bei einem standardisierten Aufgabenset. Das Experiment ist Teil der Arbeit des Frontier Red Teams, einer spezialisierten Gruppe, die Grenzfähigkeiten und Sicherheitsgrenzen der fortschrittlichsten Claude-Modelle untersucht.
Ergebnisse: 20× Geschwindigkeit und 10× weniger Code
Opus 4.7 erledigte Aufgaben ungefähr 20× schneller als das schnellste menschliche Team ohne KI-Unterstützung und rund 19× schneller als ein Team mit KI-Werkzeugen. Bei vier vergleichbaren Aufgaben generierte das Modell nur ~1.045 Zeilen Code, während das menschliche Team für dieselben Ergebnisse 10.309 Zeilen schrieb — fast zehnmal mehr. Die Ausgabequalität war gleich oder zugunsten des Modells höher.
Technischer Hintergrund
Das Experiment war als realer, nicht geskripteter Fähigkeitstest konzipiert: Opus 4.7 hatte keine vordefinierten Bewegungssequenzen, sondern plante und führte Roboterbefehle in Echtzeit aus. Der Quadruped entspricht kommerziellen Standardspezifikationen und wurde nicht für den Test modifiziert, was die Übertragbarkeit der Ergebnisse auf handelsübliche Hardware zusätzlich bestätigt. Der Vergleich mit dem KI-unterstützten Team (19× langsamer als Opus 4.7) ist entscheidend für die Kontextualisierung: Selbst mit Werkzeugen können Teams die Ausführungsgeschwindigkeit eines autonomen Modells nicht erreichen.
Fähigkeitsgrenzen und Sicherheitsaspekte
Trotz beeindruckender Ergebnisse identifizierte das Frontier Red Team eine klare Einschränkung: Präzise Closed-Loop-Steuerung — die Fähigkeit zur kontinuierlichen Bewegungsanpassung auf Basis von Echtzeit-Feedback — entgeht Opus 4.7 weiterhin. Konkret erwies sich das autonome Fangen von Bällen als zuverlässig nicht durchführbar. Diese Einschränkung ist nicht nur technischer, sondern auch sicherheitsrelevanter Natur: Präzise physische Manipulation ist Voraussetzung für eine Reihe von Anwendungen mit erhöhtem Risiko.
Bedeutung für die Industrie
Project Fetch Phase 2 setzt einen messbaren Referenzpunkt für autonome KI-Robotik: 20× Beschleunigung und 10× Codereduktion sind keine anekdotischen Resultate, sondern an einem standardisierten Aufgabenset gemessen. Für industrielle Anwendungen bedeutet das potenziell dramatisch kürzere Entwicklungs- und Integrationszyklen. Anthropic hat weder ein Produktionseinführungsdatum noch kommerzielle Robotikpläne angekündigt; die Ergebnisse werden als Forschungsarbeit behandelt.
Häufig gestellte Fragen
- Was ist Project Fetch und welchem Zweck dient es?
- Project Fetch ist eine Forschungsinitiative von Anthropics Frontier Red Team, die Claude-Modelle auf autonome Roboteraufgaben mit kommerziellen Quadrupeden-Robotern testet, um Potenzial und Sicherheit KI-gesteuerter Robotik zu messen.
- Warum hat Claude Opus 4.7 so viel weniger Code geschrieben?
- Opus 4.7 nutzt Abstraktionen auf höherer Ebene und kompaktere algorithmische Muster. Statt 10.309 Zeilen des menschlichen Teams erzielte das Modell gleiche oder bessere Ergebnisse mit nur ~1.045 Zeilen.
Verwandte Nachrichten
arXiv:2606.18543: CEO-Bench — Können KI-Agenten ein Startup langfristig führen?
AWS: Amazon Bedrock AgentCore Harness erreicht allgemeine Verfügbarkeit — Deploy in 2 API-Aufrufen
GitHub: KI-Agenten können nun vollständig triagierte Issues ohne menschliche Eingriffe erstellen