前沿模型通过 32 步企业网络攻防模拟：AI 网络安全的 2026 红线

发生了什么

State of AI 2026 年 5 月版报告披露了一个关键发现：

Anthropic 的 Claude Mythos Preview 和 OpenAI 的 GPT-5.5 均通过了英国 AI 安全研究所 (UK AISI) 设计的 32 步企业网络完全入侵模拟测试——而且是在没有防御方的情况下。

这意味着：当前最先进的 AI 模型已经具备独立完成复杂企业网络入侵的能力。

UK AISI 的评估结论是：AI 网络攻击能力正以每 4 个月翻倍的速度增长。

UK AISI 的 32 步企业网络入侵模拟覆盖了完整的攻击链：

AI 模型能够在无人工干预的情况下，自主完成全部 32 步。

对于开发和部署前沿 AI 模型的企业来说，这不再是”最佳实践”——这是法律强制要求。

AI 安全正在从技术问题变成合规问题。企业 AI 部署必须有完整的安全评估流程，否则面临法律风险。
攻击能力增长远超防御能力增长。当 AI 攻击能力每 4 个月翻倍时，传统的”打补丁”式防御已经不够用了。需要 AI 对 AI 的自动化防御体系。
开源模型的安全评估是灰色地带。UK AISI 评估的是闭源前沿模型，但开源模型（如 Qwen 3.6、DeepSeek V4、Llama 4）同样具备这些能力——谁来评估它们？

网络攻防的 AI 时代已经到来。红线不是一条——而是一整套需要重新设计的防御体系。