🟢 ⚖️ 規制 公開日: · 3 分で読めます ·

UK AISI: AIモデルの自律サイバー能力が4.7ヶ月ごとに倍増——Claude Mythos PreviewとGPT-5.5が初めてサイバーレンジを解決

Editorial illustration: AIエージェントアイコンと能力向上ベンチマークグラフを持つサイバーセキュリティ司令センター。

「自律AIサイバー能力はどのくらい速く進歩しているか?」は、英国AI安全研究所(AISI)が2026年5月13日に発表した新しいレポートです。サイバー時間ホライズンベンチマーク(250万トークン予算、80%成功閾値)を測定することで、AISIはAIモデルが自律的に解決するサイバータスクの長さが4.7ヶ月ごとに倍増していることを確認しました。Claude Mythos Previewは両方のサイバーレンジを解決した最初のモデルです(The Last Ones 60%、Cooling Tower 30%);GPT-5.5はThe Last Onesを30%で解決しました。

🤖

この記事はAIにより一次情報源から生成されました。

英国AI安全研究所(AISI)は2026年5月13日、フロンティアAIモデルの自律サイバー能力の進歩速度について初の実証的な測定を提供するレポートを発表しました。主な発見:AIモデルが自律的に解決するサイバータスクの長さは2026年2月以降4.7ヶ月ごとに倍増しており——最近のモデルはこのトレンドを大幅に上回っています。

サイバー時間ホライズンベンチマークとは何か?

AISIは、専門家の完了時間と比較してAIモデルが自律的に完了できるサイバータスクの長さを測定する正式な方法論を開発しました。このアプローチは以下を使用します:

  • 脆弱性の特定と悪用を必要とするタスクを含むナローなサイバースイート
  • 異なるモデル間の比較可能性を確保するためのタスクあたり250万トークン予算
  • 信頼性測定のための80%成功率閾値
  • エンタープライズネットワーク攻撃をシミュレートする2つのサイバーレンジ

このアプローチはARC-AGIスタイルのベンチマークに似ていますが、一般的な推論ではなくセキュリティドメインに適用されています。「4.7ヶ月の倍増」の数字は、2024年末以降のフロンティアモデルの縦断的追跡から計算されました。

どのフロンティアモデルがテストされたか?

Claude Mythos Previewは両方のサイバーレンジを解決した最初のモデルです:

  • The Last Ones:60%成功率
  • Cooling Tower:30%成功率

GPT-5.5は30%成功率でThe Last Onesを解決しました。2024年末から2026年初頭まで追跡された他のモデルは明確な進歩を示しています——次のフロンティアリリースのたびにサイバー能力のフロンティアを大幅に前進させています。

同じベンチマークでのClaude MythosとGPT-5.5の差(The Last Onesで60% vs 30%)は重要なシグナルです——Anthropic Mythos Previewは現在、防御的なサイバーセキュリティ作業のためにゲートされた研究プレビューであり、明らかにサイバータスク向けに特別に調整されています。

「4.7ヶ月ごとの倍増」は実際に何を意味するか?

フロンティアモデルが現在30分間のサイバータスク(例:識別された脆弱性の悪用1件)を自律的に解決できると仮定します。軌跡:

  • 現在(2026年5月):30分
  • 2026年10月(+4.7ヶ月):60分
  • 2027年2月(+9.4ヶ月):120分
  • 2027年6月(+14.1ヶ月):240分(4時間)
  • 2027年11月(+18.8ヶ月):480分(8時間=1完全営業日)

実際には:18ヶ月以内にフロンティアAIは人間の専門家の1日かかるサイバータスクを自律的に実行できるようになります。これはAIが攻撃的・防御的なサイバー作戦において「専門家のためのツール」から「独立したアクター」になる閾値を超えます。

AISIが強調する政策的影響は何か?

研究所は、急速な進歩が防御者と攻撃者の両方に機会とリスクを生み出すため、組織は今すぐ強固なセキュリティベースラインに投資しなければならないことを明示的に強調しています。具体的な推奨事項:

  • AI支援脆弱性発見に関する英国国家サイバーセキュリティセンター(NCSC)のガイダンスを参照
  • 「AIにはできない」という前提に依存しない多層防御アプローチを実装
  • 更新機会のためにフロンティアAI能力の進歩を継続的に監視

より広いAI安全議論における位置づけ

この発表は2026年の劇的なエージェント安全/信頼性の波に収まります:arXiv FATE(5月12日、33.5%の攻撃削減)、arXiv履歴アンカー(5月13日、91〜98%の安全でないシフト)、arXiv追従性コンセンサス(5月15日)、Microsoft Research AI委任(5月15日、19〜34%の性能低下)、arXiv GraphFlow(5月15日、形式的検証アプローチ)。UK AISIサイバーレポートは同じ根本的な問題に規制機関/国家レベルの視点を加えます:フロンティアAIシステムには現在の整合性+安全性アプローチが保証してブロックできない新興能力があります。

Anthropic Mythos Previewのステータス(2026年4月からのゲートされた研究プレビュー)は戦略的な反射です——Anthropicは明らかに防御的なサイバーセキュリティアプリケーションがアクセス制限と完全なオープンリリースの間の特別なトレードオフに値すると特定しました。UK AISIの結果はその決定に実証的な基盤を与えます。

よくある質問

サイバー時間ホライズンベンチマークとは何ですか?
サイバー時間ホライズンベンチマークは、AIモデルが自律的に完了できるタスクの長さを専門家の完了時間と比較して測定します;AISIは脆弱性の特定と悪用タスクを含むナローなサイバースイート、モデル間の比較可能性のためにタスクあたり250万トークン予算、信頼性測定のための80%成功閾値を使用します。
どのフロンティアモデルがテストされましたか?
Claude Mythos Previewは両方のサイバーレンジを解決した最初のモデルです——The Last Ones(60%成功率)とCooling Tower(30%成功率);GPT-5.5は30%成功率でThe Last Onesを解決しました;2024年末以降追跡された他のモデルは明確な進歩を示しています。