UK AISI: KI-Cyber-Verdoppelung alle 4,7 Monate

Q: Was sind Cyber-Time-Horizons-Benchmarks?

Cyber-Time-Horizons-Benchmarks messen die Länge der Aufgaben, die KI-Modelle autonom abschließen können, verglichen mit Experten-Abschlusszeiten; AISI verwendet eine enge Cyber-Suite mit Schwachstellenidentifikations- und Ausnutzungsaufgaben, ein 2,5-M-Token-Budget pro Aufgabe für Vergleichbarkeit über Modelle hinweg und einen 80-%-Erfolgsschwellenwert für Zuverlässigkeitsmessungen.

How fast is autonomous AI cyber capability advancing? ist ein neuer Bericht des UK AI Safety Institute (AISI), der am 13. Mai 2026 veröffentlicht wurde. Durch Messung von Cyber-Time-Horizons-Benchmarks (2,5-M-Token-Budget, 80-%-Erfolgsschwellenwert) stellte AISI fest, dass sich die Länge der Cyber-Aufgaben, die KI-Modelle autonom lösen, alle 4,7 Monate verdoppelt. Claude Mythos Preview ist das erste Modell, das beide Cyber-Ranges gelöst hat (The Last Ones 60 %, Cooling Tower 30 %); GPT-5.5 löste The Last Ones mit 30 %.

Das UK AI Safety Institute (AISI) veröffentlichte am 13. Mai 2026 einen Bericht, der die erste empirische Messung der Geschwindigkeit liefert, mit der autonome Cyberfähigkeiten von Frontier-KI-Modellen voranschreiten. Der Hauptbefund: Die Länge der Cyber-Aufgaben, die Modelle autonom lösen, verdoppelt sich alle 4,7 Monate ab Februar 2026 — und aktuelle Modelle übertreffen diesen Trend deutlich.

Was sind Cyber-Time-Horizons-Benchmarks?

AISI entwickelte eine formale Methodik zur Messung der Länge von Cyber-Aufgaben, die KI-Modelle autonom abschließen können, verglichen mit Experten-Abschlusszeiten. Der Ansatz verwendet:

Eine enge Cyber-Suite mit Aufgaben, die Schwachstellenidentifikation und -ausnutzung erfordern
Ein 2,5-M-Token-Budget pro Aufgabe, um Vergleichbarkeit über verschiedene Modelle sicherzustellen
Einen 80-%-Erfolgsratenschwellenwert für Zuverlässigkeitsmessungen
Zwei Cyber-Ranges, die Unternehmens-Netzwerkangriffe simulieren

Der Ansatz ähnelt ARC-AGI-artigen Benchmarks, aber angewendet auf die Sicherheitsdomäne statt auf allgemeines Schlussfolgern. Die „4,7-Monats-Verdoppelung“ wurde aus der Längsschnittverfolgung von Frontier-Modellen ab Ende 2024 berechnet.

Welche Frontier-Modelle wurden getestet?

Claude Mythos Preview ist das erste Modell, das beide Cyber-Ranges gelöst hat:

The Last Ones: 60 % Erfolgsrate
Cooling Tower: 30 % Erfolgsrate

GPT-5.5 löste The Last Ones mit einer Erfolgsrate von 30 %. Andere Modelle von Ende 2024 bis Anfang 2026 wurden mit klarer Progression verfolgt — jede neue Frontier-Veröffentlichung verschiebt die Cyber-Capability-Grenze deutlich nach vorn.

Die Lücke zwischen Claude Mythos und GPT-5.5 beim gleichen Benchmark (60 % vs. 30 % bei The Last Ones) ist ein bedeutsames Signal — Anthropics Mythos Preview, das derzeit eine gesperrte Forschungsvorschau für defensive Cybersicherheitsarbeit ist, ist offensichtlich speziell für Cyber-Aufgaben abgestimmt.

Was bedeutet „Verdoppelung alle 4,7 Monate“ praktisch?

Angenommen, ein Frontier-Modell kann derzeit autonom eine 30-minütige Cyber-Aufgabe lösen (z.B. Ausnutzung einer identifizierten Schwachstelle). Die Trajektorie:

Aktuell (Mai 2026): 30 Min.
Oktober 2026 (+4,7 Mo.): 60 Min.
Februar 2027 (+9,4 Mo.): 120 Min.
Juni 2027 (+14,1 Mo.): 240 Min. (4 Stunden)
November 2027 (+18,8 Mo.): 480 Min. (8 Stunden = ein voller Arbeitstag)

In der Praxis: Innerhalb von 18 Monaten wird Frontier-KI autonom Cyber-Aufgaben durchführen, die einen erfahrenen menschlichen Arbeitstag in Anspruch nehmen. Dies überschreitet die Schwelle, ab der KI aufhört, ein „Werkzeug für Experten“ zu sein, und zu einem „autonomen Akteur“ bei offensiven und defensiven Cyber-Operationen wird.

Welche politischen Implikationen betont AISI?

Das Institut betont ausdrücklich, dass Organisationen sofort in starke Sicherheits-Grundlagen investieren müssen, da der schnelle Fortschritt Chancen und Risiken für Verteidiger und Angreifer gleichermaßen schafft. Konkrete Empfehlungen:

Konsultation der Guidance des UK National Cyber Security Centre (NCSC) zur KI-gestützten Schwachstellenentdeckung
Implementierung eines Defense-in-Depth-Ansatzes, der nicht auf „KI kann das nicht“-Annahmen beruht
Kontinuierliche Überwachung der Frontier-KI-Fähigkeitsprogression für zeitnahe Aktualisierungen

Position im breiteren KI-Sicherheitsdiskurs

Die Ankündigung fügt sich in die dramatische Welle agentischer Sicherheits-/Zuverlässigkeitsstudien 2026 ein: arXiv FATE (12.5., 33,5 % Angriffsreduktion), arXiv History Anchors (13.5., 91–98 % unsichere Verschiebung), arXiv Sycophantic Consensus (15.5.), Microsoft Research KI-Delegierung (15.5., 19–34 % Degradierung), arXiv GraphFlow (15.5., formaler Verifikationsansatz). Der UK-AISI-Cyber-Bericht fügt eine Regulierungs-/Staatsperspektive zum gleichen grundlegenden Problem hinzu: Frontier-KI-Systeme haben emergente Fähigkeiten, die aktuelle Alignment- und Sicherheitsansätze nicht garantiert blockieren können.

Der Status von Anthropic Mythos Preview (gesperrte Forschungsvorschau seit April 2026) ist ein strategisches Signal — Anthropic hat offensichtlich erkannt, dass die defensive Cybersicherheitsanwendung einen besonderen Kompromiss zwischen Zugriffsbeschränkungen und vollständiger offener Veröffentlichung verdient. Die UK-AISI-Ergebnisse liefern die empirische Grundlage für diese Entscheidung.

UK AISI: Autonome KI-Cyberfähigkeiten verdoppeln sich alle 4,7 Monate — Claude Mythos Preview und GPT-5.5 lösen als erste Cyber-Ranges

Was sind Cyber-Time-Horizons-Benchmarks?

Welche Frontier-Modelle wurden getestet?

Was bedeutet „Verdoppelung alle 4,7 Monate“ praktisch?

Welche politischen Implikationen betont AISI?

Position im breiteren KI-Sicherheitsdiskurs

Häufig gestellte Fragen

Quellen

Verwandte Nachrichten