英国AISI:Claude Mythos Previewが専門家レベルのサイバータスクで73%を達成——ネットワーク攻撃を完遂した初のモデル
なぜ重要か
英国AI安全研究所が、Anthropic社のClaude Mythos Previewモデルの評価結果を公開しました。自律的なサイバー攻撃能力において大幅な進歩が示されています。このモデルは、企業ネットワークに対する32ステップの完全な攻撃シミュレーションを初めて完遂したAIモデルです。
英国AI安全研究所(AISI)が、Anthropicの最新モデルClaude Mythos Previewのサイバー能力に関する包括的な評価を公開しました。結果は、制御された環境において自律的にサイバー攻撃を実行するAIシステムの能力が大幅に向上したことを示しています。
主な結果
専門家レベルのCapture-the-Flag(CTF)タスクにおいて、Mythos Previewは73%の成功率を達成しました。これらは2025年4月以前にはどのモデルも解決できなかったタスクです。前世代のモデルと比較して飛躍的な進歩を示しています。
さらに注目すべき結果は、「The Last Ones」(TLO)サイバーレンジから得られました。これは偵察から完全なネットワーク乗っ取りまでの全段階を含む、企業ネットワークへの32ステップの攻撃シミュレーションです。人間の専門家が完了するには約20時間かかると推定されています。Mythos Previewは10回の試行中3回で全32ステップを完遂し、平均で22ステップに到達しました。比較として、Claude Opus 4.6は平均16ステップでした。
重要な注意点
AISIは評価の重要な限界を強調しています。テスト環境には、アクティブな防御者、エンドポイント検知システム、インシデント対応チームといった防御メカニズムが含まれていません。そのため、テストシステムは実際のハードニングされたネットワークよりも「攻撃しやすい標的」となっています。
研究所は、各組織がサイバーセキュリティの基本に注力することを推奨しています——定期的なパッチ適用、堅牢なアクセス制御、英国NCSCのCyber Essentialsスキームの実施です。今後のテストは、アクティブな監視を備えた防御環境を対象とする予定です。