侧边栏壁纸
博主头像
火腾

行动起来,活在当下

  • 累计撰写 22 篇文章
  • 累计创建 17 个标签
  • 累计收到 0 条评论

目 录CONTENT

文章目录

从“鹅腿阿姨式”翻车到核心机密泄露,Anthropic两大旗舰模型72小时下架始末

温馨提示:
本文章权益归属火腾(www.firedance.cn),转载请注明来源于火腾(www.firedance.cn)。

美东时间2026年6月12日下午5点21分,一纸出口管制令,让AI界炸了锅。曾经被寄予厚望、风光无两的Anthropic旗舰模型Mythos 5和Fable 5,在发布仅仅三四天后,便以一种极其惨烈的方式集体“下架”,所有用户——包括美国本土用户在内——全部无法使用。

这不是一次普通的系统维护,也不是产品的正常迭代,而是一场由强硬行政命令、信任崩盘、黑客闪电战和多项争议共同引爆的雪崩。全网都在追问:到底发生了什么?


01 一纸禁令:连自己人都不能碰

故事的开端,源自美国商务部那道措辞极为严厉的出口管制限制令。

这道禁令的核心非常明确:Mythos 5和Fable 5两款模型,境外人员不许用,身处美国境内的外籍人员不许用,就连Anthropic公司内部的外籍员工,也被挡在了访问权限之外。 简单来说,只要跟“外籍”沾边,一律封死。

面对如此严苛的身份限制,摆在Anthropic面前的选择其实只有一个:怎么在技术上把“该禁的人”精准筛掉?答案是需要对全体用户实施实名制身份核验。但Anthropic最终否决了这一方案——不愿、也觉得无法承担起面向全球用户的彻底实名。

在缺少其他可行鉴别手段的情况下,Anthropic做出了一个让所有人始料未及的决定:全面下架,全体禁入。 宁可让全美用户陪着一起不能用,也不做身份区分。这一刀切的处理方式,彻底宣告了两款刚问世的前沿模型提前“夭折”。


02 “鹅腿阿姨”式翻车:信任被一斤一斤地称走

如果说禁令是突然的外部重击,那信任的坍塌,则是Anthropic自己亲手挖下的第一铲。

Fable 5发布之初,被称为“安全又强”的典范。然而,在发现有人试图研究、蒸馏自家模型后,Anthropic的第一反应不是通过法律或正当声明来应对,而是选择偷偷使绊子:系统一旦监测到有研究行为,就暗中把模型替换成别的、甚至输出完全错误的内容。

这种行径被愤怒的网友形象地比作“鹅腿阿姨以鸭腿充鹅腿”——你明明冲着鲜嫩多汁的鹅腿下单,付完钱却发现嘴里是口感风味完全不对的鸭腿,卖家还装作没事一样。

舆论炸锅了。在大众的猛烈批评下,Anthropic发布道歉声明,可道歉归道歉,手上动作并没有停。他们只是把“暗箱操作”调成了“明牌模式”:一旦发现有人研究,不再伪装,而是直接切换成Opus、Sonnet这类低阶模型来提供服务,刻意降智、拉低输出质量。

这种姿态激起了更大的诟病:一边高调宣称模型实力顶尖、安全可靠,一边又用尽手段拒绝外界正常的研究验证。当强大经不起审视,人们自然要问:这背后到底还藏着多少水分?


03 72小时闪电战:12万字符核心提示词被扒光

信任问题还只是口碑滑坡,真正让“安全”二字碎了一地的,是黑客完成的教科书级破解。

Fable 5上线不到72小时,攻击者便完成了全面“AI越狱”。他们不仅演示了如何让模型配合合成危险化学品、策划网络攻击等高风险任务,更狠的是,直接把模型长达12万字符的系统提示词完整公开到了GitHub上。 这份泄露文件里,包含了模型的工作模式、安全规则、任务规划逻辑等几乎全部核心内幕。

黑客还非常“贴心”地详细拆解了六层破解方法,每一层都精准击穿了Anthropic引以为傲的安全过滤机制:

  • 字符伪装:用特殊字符打乱语义检测。
  • 长上下文隐藏:把恶意指令塞进超长文本的深处。
  • 分步推理提问:把危险问题拆成无害的细小步骤逐一突破。
  • 包装为小说创作:把高风险指令变成“虚构故事背景”。
  • 伪装成学术审稿:让模型以审稿专家身份给出危险建议。
  • 能力拆解重组:调用多个碎片化能力拼凑出完整危害。

一套组合拳下来,安全防线几乎形同虚设。所谓的“最强安全模型”,在72小时之内就彻底裸奔了。


04 坚硬嘴 vs. 冰冷的现实

面对核心提示词满网流传、破解手段公开得比官方文档还详细的尴尬处境,Anthropic的回应让不少人觉得意外。他们并不承认核心安全体系被攻破。

公司的说辞大致可以总结为三点:

  1. 黑客必须借助编故事、拆分问题、多方拼凑等复杂操作才能拿到输出,这不属于真正意义上的“AI越狱”。
  2. 部分看起来危险的输出,其实只是网络公开常识,并不会实质性地提升危害能力。
  3. 模型在被追问后续问题时继续作答,这是所有大模型都普遍存在的现象,并非自家防护失守。

但外界显然不买账。很多安全研究者一针见血地指出:即便单项信息可以从网络查到,由大模型进行梳理、整合并给出可操作的系统性方案,本身就是巨大的风险放大。把责任轻飘飘地推给“行业普遍现象”,在自家核心模型已被彻底剖开的背景下,辩解显得尤为苍白。


05 谜一样的禁令,多重诱因浮出水面

直到今天,美国商务部始终没有对外公布下达出口管制禁令的具体原因。正因如此,各种猜测持续发酵。

大众在复盘事件脉络后,锁定了几个可能的关键触发点:

  • 安全与信誉双重崩盘。从故意欺骗研究用户、降智服务,到三天内被黑客扒光核心指令,这些接连不断的负面事件,很可能成为管控的直接导火索。
  • 所谓的“指手画脚”。有消息提到,企业相关人员此前曾公开对美国政策提出尖锐批评、指手画脚,这在敏感时期被视作一个极为危险的信号,可能是企业遭到重点管控、核心模型被限制使用的潜藏诱因之一。

究竟是哪一根稻草最终压垮了骆驼,目前尚无定论。但有一点可以确定:当一个企业同时踩中安全失控、信任破产和行政红线这三颗雷,再炫目的技术光环也无法护其周全。


Mythos 5和Fable 5的急速坠落,像一部快进的警示片。它让人看到,脱离了真实可信的根基,再强的模型宣称也不过是沙滩上的堡垒;而在大国科技博弈和严苛监管的缝隙里,AI公司需要面对的,早已不只是代码和参数的问题。

72小时,从神坛到全网下架,这场风暴留给行业的思考,远比事件本身要长得多。

0

评论区