英国AISI：Claude Mythos Preview在专家级网络安全任务中达到73%——首个完成完整网络攻击的模型

英国AI安全研究所（AISI）发布了对Anthropic最新模型Claude Mythos Preview网络能力的全面评估。结果显示，AI系统在受控环境中自主执行网络攻击的能力出现了显著飞跃。

关键结果

在专家级的夺旗（CTF）任务中，Mythos Preview取得了73%的成功率——而这些任务在2025年4月之前没有任何模型能够解决。这代表了相较于前几代模型的巨大进步。

更令人印象深刻的结果来自”The Last Ones”（TLO）网络靶场——一个模拟针对企业网络的32步攻击，涵盖从侦察到完全控制网络的所有阶段。据估计，人类专家完成该任务大约需要20小时。Mythos Preview在10次尝试中有3次成功完成了全部32个步骤，平均达到22个步骤。相比之下，Claude Opus 4.6平均达到16个步骤。

重要说明

AISI强调了评估的关键局限性：测试环境缺乏防御机制，如主动防御者、端点检测系统和事件响应团队。这使得测试系统比真实的加固网络更”容易攻破”。

该研究所建议各组织重点关注网络安全基础——定期打补丁、健全的访问控制以及实施英国NCSC的网络安全基本方案。未来的测试将针对有主动监控的防御环境展开。

英国AISI：Claude Mythos Preview在专家级网络安全任务中达到73%——首个完成完整网络攻击的模型

关键结果

重要说明

来源

相关新闻