🤖 24 AI
🔴 🛡️ 安全 2026年4月14日星期二 · 1 分钟阅读

英国AISI:Claude Mythos Preview在专家级网络安全任务中达到73%——首个完成完整网络攻击的模型

为什么重要

英国AI安全研究所发布了对Anthropic公司Claude Mythos Preview模型的评估报告,显示其在自主网络攻击能力方面取得了显著进步。该模型是首个成功完成针对企业网络的完整32步攻击模拟的AI模型。

英国AI安全研究所(AISI)发布了对Anthropic最新模型Claude Mythos Preview网络能力的全面评估。结果显示,AI系统在受控环境中自主执行网络攻击的能力出现了显著飞跃。

关键结果

在专家级的夺旗(CTF)任务中,Mythos Preview取得了73%的成功率——而这些任务在2025年4月之前没有任何模型能够解决。这代表了相较于前几代模型的巨大进步。

更令人印象深刻的结果来自”The Last Ones”(TLO)网络靶场——一个模拟针对企业网络的32步攻击,涵盖从侦察到完全控制网络的所有阶段。据估计,人类专家完成该任务大约需要20小时。Mythos Preview在10次尝试中有3次成功完成了全部32个步骤,平均达到22个步骤。相比之下,Claude Opus 4.6平均达到16个步骤。

重要说明

AISI强调了评估的关键局限性:测试环境缺乏防御机制,如主动防御者、端点检测系统和事件响应团队。这使得测试系统比真实的加固网络更”容易攻破”。

该研究所建议各组织重点关注网络安全基础——定期打补丁、健全的访问控制以及实施英国NCSC的网络安全基本方案。未来的测试将针对有主动监控的防御环境展开。

🤖 本文由人工智能基于一手来源生成。