Anthropic 正在扩大对 Claude Mythos 的受控访问范围。公司表示,约 150 家新机构将被纳入 Project Glasswing,以便在模型更大范围推出前,提前发现漏洞、修复缺陷并评估潜在滥用风险。
这项安排覆盖科技公司、安全机构和政府部门。Anthropic 称,新增合作方需先满足安全要求,才能获得访问权限。公司此前还表示,在完成额外防护措施后,未来数周可能向更多客户开放 Mythos 级模型。
已发现上万项高危漏洞
Claude Mythos 在今年 3 月因相关材料外泄而进入公众视野。Anthropic 现在披露,较早获得访问权限的机构,已利用 Mythos Preview 识别出超过 1 万项高危或严重级别的软件漏洞。
这些合作方还在用该模型编写补丁、进行安全审查,并在软件发布前完成测试。Anthropic 认为,在攻击者获得同等级能力前,防御方需要先拿到更强的 AI 工具。
- 新增合作机构约 150 家
- 已识别高危或严重漏洞超 1 万项
- 更广泛客户开放预计在未来数周推进
网络安全能力引发持续审视
随着模型能力提升,研究人员和政府机构也在持续评估其网络攻击风险。英国 AI Security Institute 曾报告,Mythos 在测试中自主完成了一次模拟企业网络攻击的 32 个步骤。
Mozilla 表示,该模型曾识别出 Firefox 浏览器中的 271 个漏洞,随后这些问题被修复。安全初创公司 Calif 则称,预览版模型帮助研究人员构建了一条针对苹果 M5 芯片的利用链。
这类表现强化了外界的担忧:更强的模型既能帮助防守,也可能降低复杂网络攻击的执行门槛。Anthropic 认为,未来 6 到 12 个月内,其他开发者也可能推出同等级模型,而且未必具备相近的安全限制。
递交 IPO 申请后推进开放计划
在扩大测试范围前一天,Anthropic 已向美国证券交易委员会秘密递交 IPO 申请,启动上市准备。此次扩大 Glasswing 计划,也让市场更关注公司如何在商业化推进与安全控制之间取得平衡。
按 Anthropic 的说法,前沿模型的发布将越来越敏感,尤其是在网络安全等同时影响攻击方与防御方的领域。公司希望通过受控开放,让防御方先建立工具优势,再决定更广泛的发布节奏。

