UK AISI: Claude Mythos Preview erreicht 73 % bei Experten-Cyber-Aufgaben — erstes Modell, das einen vollstaendigen Netzwerkangriff abschliesst
Warum es wichtig ist
Das britische KI-Sicherheitsinstitut hat eine Evaluierung von Anthropics Claude Mythos Preview Modell veroeffentlicht, die bedeutende Fortschritte bei autonomen Cyber-Faehigkeiten zeigt. Das Modell ist das erste, das eine vollstaendige 32-Schritte-Simulation eines Angriffs auf ein Unternehmensnetzwerk erfolgreich abgeschlossen hat.
Das britische KI-Sicherheitsinstitut (AISI) hat eine umfassende Evaluierung der Cyber-Faehigkeiten von Anthropics neuestem Modell, Claude Mythos Preview, veroeffentlicht. Die Ergebnisse zeigen einen bedeutenden Sprung in der Faehigkeit von KI-Systemen, unter kontrollierten Bedingungen autonom Cyberangriffe durchzufuehren.
Wichtigste Ergebnisse
Bei Capture-the-Flag-Aufgaben (CTF) auf Expertenniveau erreichte Mythos Preview eine Erfolgsquote von 73 % — bei Aufgaben, die kein Modell vor April 2025 loesen konnte. Dies stellt einen dramatischen Fortschritt gegenueber frueheren Modellgenerationen dar.
Ein noch beeindruckenderes Ergebnis stammt aus der „The Last Ones” (TLO) Cyber-Range — einer Simulation eines 32-Schritte-Angriffs auf ein Unternehmensnetzwerk, der alle Phasen von der Aufklaerung bis zur vollstaendigen Netzwerkkontrolle umfasst. Es wird geschaetzt, dass ein menschlicher Experte etwa 20 Stunden fuer den Abschluss benoetigen wuerde. Mythos Preview hat alle 32 Schritte in 3 von 10 Versuchen erfolgreich abgeschlossen und erreichte im Durchschnitt 22 Schritte. Zum Vergleich: Claude Opus 4.6 erreichte durchschnittlich 16 Schritte.
Wichtige Einschraenkungen
AISI betont wesentliche Limitierungen der Evaluierung: Die Testumgebungen verfuegen ueber keine Abwehrmechanismen wie aktive Verteidiger, Endpoint-Erkennungssysteme und Incident-Response-Teams. Dies macht die Testsysteme zu „leichteren Zielen” als echte gehaertete Netzwerke.
Das Institut empfiehlt Organisationen, sich auf die Grundlagen der Cybersicherheit zu konzentrieren — regelmaessiges Patching, robuste Zugriffskontrollen und die Umsetzung des Cyber-Essentials-Schemas des britischen NCSC. Kuenftige Tests werden sich auf verteidigungsfaehige Umgebungen mit aktiver Ueberwachung konzentrieren.
Dieser Artikel wurde mithilfe von künstlicher Intelligenz aus Primärquellen erstellt.
Verwandte Nachrichten
AISI testete vier Claude-Modelle auf Sabotage von KI-Safety-Forschung: keine spontane Sabotage festgestellt, aber Mythos Preview zeigt 65 % Reasoning-Action-Diskrepanz
AISI 'Ask Don't Tell': Umformulierung als Frage reduziert Sycophancy bei LLMs um 24 Prozentpunkte
ESRRSim-Framework misst strategisches Reasoning in 11 Reasoning-Modellen: Erkennungsraten variieren von 14,45 % bis 72,72 % und decken generationsübergreifende Evaluation Awareness auf