美国政府周五要求 Anthropic 立即关闭 Claude Fable 5 和 Claude Mythos 5 的访问权限,理由是国家安全与出口管制。Anthropic 称已遵守指令,但不同意政府判断;这次关闭面向全球所有用户,不只限于外国国民,公司其他 Claude 模型不受影响。

这件事的分量,不在于政府已经证明两款模型造成了重大安全灾难。按 Anthropic 的说法,政府目前只给出口头层面的、狭窄且非通用的潜在 jailbreak 证据。更大的问题是:一家以安全为品牌核心的前沿 AI 公司,过去数月反复强调模型能力危险,可能反过来提高了监管部门按下暂停键的意愿。

政府关停的是 Anthropic 最敏感的两张牌

Mythos 5 是 Anthropic 迄今最强的模型之一。公司此前将它定位为极强的漏洞发现工具,称其在测试中能识别主流操作系统和浏览器中的缺陷。正因如此,Mythos 没有公开发布,而是通过 Project Glasswing 提供给约 50 家经过审查的机构,包括 Amazon、Apple、Google、Microsoft 和 CrowdStrike,用于防御性网络安全工作。

Fable 5 则是商业化压力下的公众版本。它发布仅三天,被 Anthropic 描述为带有护栏的 Mythos 版本,会在网络安全、生物等高风险领域阻断回答,公司认为已经足够安全,可以面向公众商用。

模型原本定位访问范围本次变化
Claude Mythos 5高能力漏洞发现模型Project Glasswing 下约 50 家 vetted 机构全球关闭访问
Claude Fable 5加护栏的公众商用版本面向公众发布,发布仅三天全球关闭访问
其他 Claude 模型常规商业与开发者模型原有用户继续使用不受本次指令影响

受影响最直接的是两类人。一类是刚开始评估 Fable 5 的企业客户和开发者,采购测试、迁移计划、内部安全评审都会被迫暂停。另一类是参与 Mythos 受控项目的安全团队,他们原本用这类模型做漏洞排查,现在需要回到原有工具链,或转向其他供应商的模型。

争议不在“有没有 jailbreak”,而在召回标准

Anthropic 承认政府关注点可能与 Fable 5 的 jailbreak 有关,但公司说证据只停留在“让模型阅读特定代码库并识别软件缺陷”的狭窄场景。它的反驳很直接:这种能力已经存在于其他公开模型中,包括 OpenAI 的 GPT-5.5,也被网络安全从业者日常用于防御。

这里有一个原文之外更现实的限制:前沿模型的安全护栏通常不是单一开关。Anthropic 称,其最强防护依赖独立分类器系统,与模型本体分离。换言之,即使用户诱导 Fable 继续输出,最危险内容仍可能被外层系统挡住。政府是否认可这种分层防护,将直接影响以后模型发布的合规标准。

这也是本案最值得行业盯住的地方。如果一个“潜在、狭窄、非通用”的 jailbreak 就足以触发全球关停,那么前沿模型公司以后不会只担心技术测试失败,还要担心监管部门把任何可复现边界案例视为召回理由。对安全团队来说,这是审查门槛上升;对产品团队来说,这是发布节奏变慢。

安全品牌变成监管靶心,Anthropic 被自己的话术困住

Anthropic 长期把自己塑造成更谨慎的 AI 公司。这个定位曾带来商业优势:企业客户、政策制定者和资本市场都愿意相信,一个愿意谈风险的公司比只谈能力的公司更可靠。但 Mythos 的宣传也留下了反作用力。你反复告诉外界自己造出了危险能力,监管部门自然更容易把你列入高优先级名单。

OpenAI CEO Sam Altman 今年 4 月曾批评 Anthropic 对 Mythos 的表述是“恐惧式营销”,大意是先说自己造出一颗炸弹,再出售避难所。这个说法带有竞争对手的刺,但并非全无命中。AI 公司把“我更安全”做成品牌时,必须同时承担“我更危险”的监管含义。

这件事还会影响 Anthropic 的资本叙事。公司被外界普遍预期将推进 IPO,但目前没有公开证据显示具体时间、估值或财务损失。能确认的是,商业发布的不确定性上升了:投资人会追问,最强模型从内部评测、受控开放到公众发布,每一步是否都可能被政府临时叫停。

接下来最该观察三个变量:政府是否提交书面技术证据;关停是否会转为有条件恢复,例如只开放给美国机构或特定安全客户;行业是否会形成统一召回标准。若没有清晰标准,前沿模型发布会进入“能上线,但不知何时会被撤”的灰区。