UK AISI: Claude Mythos Preview erreicht 73 % bei Experten-Cyber-Aufgaben — erstes Modell, das einen vollstaendigen Netzwerkangriff abschliesst
Warum es wichtig ist
Das britische KI-Sicherheitsinstitut hat eine Evaluierung von Anthropics Claude Mythos Preview Modell veroeffentlicht, die bedeutende Fortschritte bei autonomen Cyber-Faehigkeiten zeigt. Das Modell ist das erste, das eine vollstaendige 32-Schritte-Simulation eines Angriffs auf ein Unternehmensnetzwerk erfolgreich abgeschlossen hat.
Das britische KI-Sicherheitsinstitut (AISI) hat eine umfassende Evaluierung der Cyber-Faehigkeiten von Anthropics neuestem Modell, Claude Mythos Preview, veroeffentlicht. Die Ergebnisse zeigen einen bedeutenden Sprung in der Faehigkeit von KI-Systemen, unter kontrollierten Bedingungen autonom Cyberangriffe durchzufuehren.
Wichtigste Ergebnisse
Bei Capture-the-Flag-Aufgaben (CTF) auf Expertenniveau erreichte Mythos Preview eine Erfolgsquote von 73 % — bei Aufgaben, die kein Modell vor April 2025 loesen konnte. Dies stellt einen dramatischen Fortschritt gegenueber frueheren Modellgenerationen dar.
Ein noch beeindruckenderes Ergebnis stammt aus der „The Last Ones” (TLO) Cyber-Range — einer Simulation eines 32-Schritte-Angriffs auf ein Unternehmensnetzwerk, der alle Phasen von der Aufklaerung bis zur vollstaendigen Netzwerkkontrolle umfasst. Es wird geschaetzt, dass ein menschlicher Experte etwa 20 Stunden fuer den Abschluss benoetigen wuerde. Mythos Preview hat alle 32 Schritte in 3 von 10 Versuchen erfolgreich abgeschlossen und erreichte im Durchschnitt 22 Schritte. Zum Vergleich: Claude Opus 4.6 erreichte durchschnittlich 16 Schritte.
Wichtige Einschraenkungen
AISI betont wesentliche Limitierungen der Evaluierung: Die Testumgebungen verfuegen ueber keine Abwehrmechanismen wie aktive Verteidiger, Endpoint-Erkennungssysteme und Incident-Response-Teams. Dies macht die Testsysteme zu „leichteren Zielen” als echte gehaertete Netzwerke.
Das Institut empfiehlt Organisationen, sich auf die Grundlagen der Cybersicherheit zu konzentrieren — regelmaessiges Patching, robuste Zugriffskontrollen und die Umsetzung des Cyber-Essentials-Schemas des britischen NCSC. Kuenftige Tests werden sich auf verteidigungsfaehige Umgebungen mit aktiver Ueberwachung konzentrieren.
Verwandte Nachrichten
ArXiv: Algorithmische Monokultur — LLMs koennen nicht divergieren, wenn sie es sollten
ArXiv OpenKedge: Kryptographisches Protokoll, das vor jeder KI-Agentenaktion eine Genehmigung verlangt
GitHub: Lernen Sie, KI-Agenten durch ein interaktives Sicherheitsspiel zu hacken