英国AISI：Claude Mythos Previewが専門家レベルのサイバータスクで73%を達成——ネットワーク攻撃を完遂した初のモデル

英国AI安全研究所（AISI）が、Anthropicの最新モデルClaude Mythos Previewのサイバー能力に関する包括的な評価を公開しました。結果は、制御された環境において自律的にサイバー攻撃を実行するAIシステムの能力が大幅に向上したことを示しています。

主な結果

専門家レベルのCapture-the-Flag（CTF）タスクにおいて、Mythos Previewは73%の成功率を達成しました。これらは2025年4月以前にはどのモデルも解決できなかったタスクです。前世代のモデルと比較して飛躍的な進歩を示しています。

さらに注目すべき結果は、「The Last Ones」（TLO）サイバーレンジから得られました。これは偵察から完全なネットワーク乗っ取りまでの全段階を含む、企業ネットワークへの32ステップの攻撃シミュレーションです。人間の専門家が完了するには約20時間かかると推定されています。Mythos Previewは10回の試行中3回で全32ステップを完遂し、平均で22ステップに到達しました。比較として、Claude Opus 4.6は平均16ステップでした。

重要な注意点

AISIは評価の重要な限界を強調しています。テスト環境には、アクティブな防御者、エンドポイント検知システム、インシデント対応チームといった防御メカニズムが含まれていません。そのため、テストシステムは実際のハードニングされたネットワークよりも「攻撃しやすい標的」となっています。

研究所は、各組織がサイバーセキュリティの基本に注力することを推奨しています——定期的なパッチ適用、堅牢なアクセス制御、英国NCSCのCyber Essentialsスキームの実施です。今後のテストは、アクティブな監視を備えた防御環境を対象とする予定です。

英国AISI：Claude Mythos Previewが専門家レベルのサイバータスクで73%を達成——ネットワーク攻撃を完遂した初のモデル

主な結果

重要な注意点

出典

関連ニュース