UK AISI: Autonome KI-Cyberfähigkeiten verdoppeln sich alle 4,7 Monate — Claude Mythos Preview und GPT-5.5 lösen als erste Cyber-Ranges
How fast is autonomous AI cyber capability advancing? ist ein neuer Bericht des UK AI Safety Institute (AISI), der am 13. Mai 2026 veröffentlicht wurde. Durch Messung von Cyber-Time-Horizons-Benchmarks (2,5-M-Token-Budget, 80-%-Erfolgsschwellenwert) stellte AISI fest, dass sich die Länge der Cyber-Aufgaben, die KI-Modelle autonom lösen, alle 4,7 Monate verdoppelt. Claude Mythos Preview ist das erste Modell, das beide Cyber-Ranges gelöst hat (The Last Ones 60 %, Cooling Tower 30 %); GPT-5.5 löste The Last Ones mit 30 %.
Dieser Artikel wurde mithilfe von künstlicher Intelligenz aus Primärquellen erstellt.
Das UK AI Safety Institute (AISI) veröffentlichte am 13. Mai 2026 einen Bericht, der die erste empirische Messung der Geschwindigkeit liefert, mit der autonome Cyberfähigkeiten von Frontier-KI-Modellen voranschreiten. Der Hauptbefund: Die Länge der Cyber-Aufgaben, die Modelle autonom lösen, verdoppelt sich alle 4,7 Monate ab Februar 2026 — und aktuelle Modelle übertreffen diesen Trend deutlich.
Was sind Cyber-Time-Horizons-Benchmarks?
AISI entwickelte eine formale Methodik zur Messung der Länge von Cyber-Aufgaben, die KI-Modelle autonom abschließen können, verglichen mit Experten-Abschlusszeiten. Der Ansatz verwendet:
- Eine enge Cyber-Suite mit Aufgaben, die Schwachstellenidentifikation und -ausnutzung erfordern
- Ein 2,5-M-Token-Budget pro Aufgabe, um Vergleichbarkeit über verschiedene Modelle sicherzustellen
- Einen 80-%-Erfolgsratenschwellenwert für Zuverlässigkeitsmessungen
- Zwei Cyber-Ranges, die Unternehmens-Netzwerkangriffe simulieren
Der Ansatz ähnelt ARC-AGI-artigen Benchmarks, aber angewendet auf die Sicherheitsdomäne statt auf allgemeines Schlussfolgern. Die „4,7-Monats-Verdoppelung“ wurde aus der Längsschnittverfolgung von Frontier-Modellen ab Ende 2024 berechnet.
Welche Frontier-Modelle wurden getestet?
Claude Mythos Preview ist das erste Modell, das beide Cyber-Ranges gelöst hat:
- The Last Ones: 60 % Erfolgsrate
- Cooling Tower: 30 % Erfolgsrate
GPT-5.5 löste The Last Ones mit einer Erfolgsrate von 30 %. Andere Modelle von Ende 2024 bis Anfang 2026 wurden mit klarer Progression verfolgt — jede neue Frontier-Veröffentlichung verschiebt die Cyber-Capability-Grenze deutlich nach vorn.
Die Lücke zwischen Claude Mythos und GPT-5.5 beim gleichen Benchmark (60 % vs. 30 % bei The Last Ones) ist ein bedeutsames Signal — Anthropics Mythos Preview, das derzeit eine gesperrte Forschungsvorschau für defensive Cybersicherheitsarbeit ist, ist offensichtlich speziell für Cyber-Aufgaben abgestimmt.
Was bedeutet „Verdoppelung alle 4,7 Monate“ praktisch?
Angenommen, ein Frontier-Modell kann derzeit autonom eine 30-minütige Cyber-Aufgabe lösen (z.B. Ausnutzung einer identifizierten Schwachstelle). Die Trajektorie:
- Aktuell (Mai 2026): 30 Min.
- Oktober 2026 (+4,7 Mo.): 60 Min.
- Februar 2027 (+9,4 Mo.): 120 Min.
- Juni 2027 (+14,1 Mo.): 240 Min. (4 Stunden)
- November 2027 (+18,8 Mo.): 480 Min. (8 Stunden = ein voller Arbeitstag)
In der Praxis: Innerhalb von 18 Monaten wird Frontier-KI autonom Cyber-Aufgaben durchführen, die einen erfahrenen menschlichen Arbeitstag in Anspruch nehmen. Dies überschreitet die Schwelle, ab der KI aufhört, ein „Werkzeug für Experten“ zu sein, und zu einem „autonomen Akteur“ bei offensiven und defensiven Cyber-Operationen wird.
Welche politischen Implikationen betont AISI?
Das Institut betont ausdrücklich, dass Organisationen sofort in starke Sicherheits-Grundlagen investieren müssen, da der schnelle Fortschritt Chancen und Risiken für Verteidiger und Angreifer gleichermaßen schafft. Konkrete Empfehlungen:
- Konsultation der Guidance des UK National Cyber Security Centre (NCSC) zur KI-gestützten Schwachstellenentdeckung
- Implementierung eines Defense-in-Depth-Ansatzes, der nicht auf „KI kann das nicht“-Annahmen beruht
- Kontinuierliche Überwachung der Frontier-KI-Fähigkeitsprogression für zeitnahe Aktualisierungen
Position im breiteren KI-Sicherheitsdiskurs
Die Ankündigung fügt sich in die dramatische Welle agentischer Sicherheits-/Zuverlässigkeitsstudien 2026 ein: arXiv FATE (12.5., 33,5 % Angriffsreduktion), arXiv History Anchors (13.5., 91–98 % unsichere Verschiebung), arXiv Sycophantic Consensus (15.5.), Microsoft Research KI-Delegierung (15.5., 19–34 % Degradierung), arXiv GraphFlow (15.5., formaler Verifikationsansatz). Der UK-AISI-Cyber-Bericht fügt eine Regulierungs-/Staatsperspektive zum gleichen grundlegenden Problem hinzu: Frontier-KI-Systeme haben emergente Fähigkeiten, die aktuelle Alignment- und Sicherheitsansätze nicht garantiert blockieren können.
Der Status von Anthropic Mythos Preview (gesperrte Forschungsvorschau seit April 2026) ist ein strategisches Signal — Anthropic hat offensichtlich erkannt, dass die defensive Cybersicherheitsanwendung einen besonderen Kompromiss zwischen Zugriffsbeschränkungen und vollständiger offener Veröffentlichung verdient. Die UK-AISI-Ergebnisse liefern die empirische Grundlage für diese Entscheidung.
Häufig gestellte Fragen
- Was sind Cyber-Time-Horizons-Benchmarks?
- Cyber-Time-Horizons-Benchmarks messen die Länge der Aufgaben, die KI-Modelle autonom abschließen können, verglichen mit Experten-Abschlusszeiten; AISI verwendet eine enge Cyber-Suite mit Schwachstellenidentifikations- und Ausnutzungsaufgaben, ein 2,5-M-Token-Budget pro Aufgabe für Vergleichbarkeit über Modelle hinweg und einen 80-%-Erfolgsschwellenwert für Zuverlässigkeitsmessungen.
- Welche Frontier-Modelle wurden getestet?
- Claude Mythos Preview ist das erste Modell, das beide Cyber-Ranges gelöst hat — The Last Ones (60 % Erfolgsrate) und Cooling Tower (30 % Erfolgsrate); GPT-5.5 löste The Last Ones mit einer Erfolgsrate von 30 %; andere Modelle werden seit Ende 2024 mit klarer Progression verfolgt.
Verwandte Nachrichten
UK AI Safety Institute: Aufsicht über fortgeschrittene KI-Systeme wird schwieriger — 20+ Degradierungspfade identifiziert
EU AI Office: Entwurf von Leitlinien zur Hochrisiko-KI-Klassifizierung
Google DeepMind und Singapur: Nationale KI-Partnerschaft in Gesundheit, Bildung und Umwelt