mt logoMyToken
ETH Gas
EN

美国政府禁止外国人使用 Fable 5,Anthropic 发文驳斥

Favoritecollect
Shareshare

作者: 熊磊

编辑:徐青阳

美国当地时间6月12日,一场AI监管史上罕见的政企正面交锋,在本周五骤然引爆。

美国政府以国家安全为由,向 Anthropic 发出出口管制指令,要求立即暂停所有外国主体对 Fable 5 和Mythos 5两款AI模型的访问权限。该指令覆盖范围极广,不仅适用于美国境外的外国用户,也适用于身处美国境内的外国公民,甚至包括Anthropic公司内部的外籍员工。

作为合规措施,Anthropic不得不对所有用户全面关闭这两款模型的访问入口——这是目前能够确保合规的唯一可行方案,因为公司无法在技术层面精确区分“外国主体”与“美国公民”的用户群。 公司其他模型的访问不受影响,用户将自动回退至Claude Opus 4.8。

这一紧急叫停来得猝不及防。Fable 5和Mythos 5于6月9日正式发布,距今仅三天。两款模型的突然下架,在科技界和AI社区引发了广泛震动。

要理解这场风波的核心张力,需要先了解Fable 5和Mythos 5是什么样的模型,以及为何它们从一开始就处于监管的聚光灯之下。

Mythos是Anthropic在能力层级上高于Opus系列的全新模型家族,代表了目前Anthropic可公开部署的最高能力水平。第一款Mythos类模型Claude Mythos Preview于今年4月通过“Project Glasswing”项目发布,访问权限严格限定于少数合作伙伴,理由是其在网络安全领域的能力过于强大,不适合广泛开放。

Fable 5是首款面向公众正式开放的Mythos级模型,能力超过Anthropic此前发布的所有可用模型,在软件工程、知识工作、视觉理解、科学研究等几乎所有测试基准上均达到业界顶尖水平。

为了实现公开发布,Anthropic为Fable 5配备了专门的安全防护机制——在网络安全、生物、化学等高风险领域,模型会自动屏蔽响应并回退至Claude Opus 4.8处理。

Mythos 5则是在同一底层模型基础上、配备较少安全防护的版本,仅向此前已获得Project Glasswing访问权限的批准机构开放,定位为面向网络安全防御者和关键基础设施运营者的专业工具。两款模型定价相同,均为每百万输入token 10美元、每百万输出token 50美元。

据报道,美国商务部长 霍华德·卢特尼克 (Howard Lutnick)于6月12日向Anthropic首席执行官达里奥·阿莫迪伊( Dario Amodei )发出信函,宣布Mythos 5和Fable 5将受到出口管制。触发这一决定的直接原因,是另一家公司声称能够对Mythos实施“越狱”,令特朗普政府对潜在的国家安全风险产生警觉。

据悉,特朗普政府此前曾尝试阻止Anthropic发布这两款模型,但未能成功——这才促使政府随后采取了出口管制这一更强硬的手段。

面对这道突如其来的指令,Anthropic在合规执行的同时,发布了一份措辞罕见强硬的长篇声明,对政府的理由提出了系统性反驳。

Anthropic认为,政府所掌握的“越狱”证据,仅涉及一种范围极窄、无法通用的攻击方式,本质上是要求模型读取特定代码库并修复其中的软件漏洞——这类能力在包括OpenAI GPT-5.5在内的其他公开可用模型上同样存在,且每天都被网络安全防御人员用于正常的系统维护工作。

Anthropic在声明中明确表示,若将“存在范围有限的潜在越狱”作为召回已部署商业模型的标准,实际上将导致整个行业所有前沿模型的新部署全面停滞。公司同时强调,政府此次行动未遵循此前曾公开呼吁的透明、公正、以技术事实为基础的法定程序。

Anthropic表示,将遵守政府的合法指令,同时正在积极努力与政府沟通,争取尽快恢复访问权限,并将在未来24小时内公布更多技术细节。公司认为此次事件源于误解,并对给用户带来的不便深表歉意。

美国政府依据国家安全授权,发布出口管制指令,要求暂停所有外国公民访问Fable 5和Mythos 5的权限,无论其身处美国境内还是境外,包括Anthropic的外籍员工。该指令的实际效果是:我们必须立即对所有用户关闭Fable 5和Mythos 5,以确保合规。其他Anthropic模型不受影响。

我们于今日美东时间下午5时21分收到该指令。信函未说明具体的国家安全方面的顾虑。据我们了解,政府认为其已掌握一种绕过Fable 5安全防护的方法,即所谓的“越狱”技术。我们审查了该技术的演示,发现其仅能识别少量此前已知的、影响较小的漏洞。这些漏洞均较为简单,其他公开可用的模型无需越狱也能发现同样的问题。

Anthropic在Fable发布博客文章中阐述了我们对其安全防护的立场,具体如下:

我们建立了强有力的安全防护机制,大幅降低了Fable被滥用于网络安全等相关任务的可能性。事实上,部分用户反映我们的防护措施过于严格。

Fable发布前数周,Anthropic与美国政府、英国AI安全研究所、多家第三方机构及内部团队合作,对Fable的安全防护进行了累计数千小时的红队测试。测试结果表明,Fable的安全防护效果明显优于此前任何已部署的模型。

目前尚无测试人员能够找到“通用越狱”方法——即一种能够全面突破模型安全防护、解锁大范围网络攻击能力的越狱方式。

我们认为,目前任何模型提供商都无法实现完美的越狱防护。业内所有防护机制均存在被“非通用越狱”突破的可能(即在特定情况下获取部分网络信息),未来也可能出现通用越狱方法。这一点我们在Fable 5发布时已明确说明。

鉴于完美的越狱防护目前并不可行,Anthropic对Fable 5采取了纵深防御策略。我们的目标是使越狱攻击要么范围极窄(针对非通用越狱),要么成本极高(针对通用越狱),并辅以全面监控,以便迅速发现并遏制任何成功的攻击行为。这也是Anthropic要求客户数据保留30天的原因——尽管这一政策对我们的客户关系带来了实际影响,但它有助于我们研究和应对越狱风险。

我们坚持这一纵深防御策略。它有效降低了Fable带来的风险,使其与业内现有已部署模型的风险水平相当。

迄今为止,我们甚至未收到任何关于可能导致有害后果的非通用越狱的正式披露。已披露给我们的潜在越狱案例,要么完全无害,要么仅属于无法体现Mythos专属能力的轻微发现。

目前,美国政府仅向我们提供了口头证据,涉及一种潜在的、范围有限的非通用越狱方式,其本质是要求模型读取特定代码库并修复其中的软件漏洞。据我们了解,该潜在越狱方式已被分享给政府。我们审查了一份报告——我们认为正是这份报告构成了政府发布该指令的依据——并已核实,报告中所展示的能力水平在其他模型中同样普遍存在(包括OpenAI的GPT-5.5),且每天都被网络安全防御人员用于维护系统安全。我们将在未来24小时内公布更多细节。

我们将遵守政府的合法指令,对所有用户关闭Fable 5和Mythos 5的访问权限。但我们不认同发现一个范围有限的潜在越狱方式就足以构成召回一款已向数亿用户部署的商业模型的理由。若将这一标准适用于整个行业,实际上将导致所有前沿模型提供商的新模型部署全面停滞。

我们曾公开表明,政府应有权依据透明、公正、明确且以技术事实为基础的法定程序,阻止不安全的模型部署。此次行动并未遵循上述原则。

对于给用户带来的不便,我们深表歉意。我们认为此次事件源于误解,并正积极努力,争取尽快恢复访问权限。

Disclaimer: This article is copyrighted by the original author and does not represent MyToken’s views and positions. If you have any questions regarding content or copyright, please contact us.(www.mytokencap.com)contact
More exciting content is available on
X(https://x.com/MyTokencap)
or join the community to learn more:MyToken-English Telegram Group
https://t.me/mytokenGroup