TechCrunch AI ★ 61 4 min

Anthropic’s safety warnings may have just backfired — the government has pulled the plug on its most powerful AI

🔗 https://techcrunch.com/2026/06/12/anthropics-safety-warnings-may-have-just-backfired-the-government-has-pulled-the-plug-on-its-most-powerful-ai/

📌 【Anthropic 重大危機】安全警告反成導火線?美國政府強制下架最強模型 Claude Mythos 5

當 AI 的能力強到能發現所有主流作業系統的漏洞時,它究竟是防禦的利器,還是國安的威脅?Anthropic 這次的處境正說明了 AI 研發中「能力」與「安全」之間最激烈的衝突。

🇺🇸 政府強令下架:全球使用者同步失去存取權

美國政府於上週五正式下令,要求 Anthropic 立即關閉其兩款最強大模型 —— Claude Fable 5 與 Claude Mythos 5 的所有存取權。值得關注的是,這項指令並非僅針對出口管制中的特定外國國民,而是強制要求對「全球所有使用者」禁用。Anthropic 已確認配合執行,但明確表示政府此次的決定是錯誤的。

🛡️ 從 Project Glasswing 到 Fable 5 的策略佈局

這次被禁的兩款模型,代表了 Anthropic 對於「能力釋放」的不同策略:

  • Claude Mythos 5(最高能力版):這是 Anthropic 最強的模型,因其能精準找出軟體安全漏洞的能力極其驚人(測試中發現了所有主流 OS 與瀏覽器的漏洞),因此公司採取極其嚴格的限制,僅透過「Project Glasswing」計畫開放給 Amazon、Apple、Google、Microsoft 及 CrowdStrike 等約 50 家經過審核的機構,用於防禦性資安工作。
  • Claude Fable 5(商用安全版):為了回應商業壓力,Anthropic 在三天前推出了 Fable 5。這本質上是 Mythos 5 的「加裝護欄版」,旨在封鎖資安與生物學等高風險領域的回應,使其足以對大眾公開。根據 Vals AI 的基準測試,Fable 5 在發布之初即成為市面上最強的公開 AI 模型。

⚠️ 出口管制的名義 vs. 實際的「越獄」疑慮

雖然政府將此指令定調為「出口管制」行動,但 Anthropic 在部落格中揭露了更深層的矛盾:政府真正的擔憂在於 Fable 5 疑似被「越獄 (Jailbreak)」。然而,Anthropic 指出,截至目前為止,政府僅提供了口頭證據,並未提供實質證明 Fable 5 的安全護欄已失效。

💡 技術洞察:當 AI 發現漏洞的速度超過修補速度

這起事件揭示了一個 AI 時代的殘酷現實:當一個模型具備發現所有主流 OS 漏洞的能力時,即便設定了護欄,只要存在 1% 的越獄可能,該模型在政府眼中就從「資安工具」變成了「大規模攻擊武器」。

這也讓業界重新思考:對於具備極高破壞潛力的模型,單靠 Prompt-level 的護欄(Guardrails)是否足以說服監管機構?

🎯 實務啟示:AI 研發的「能力-安全」權衡

對於 AI 開發者與企業,這次事件提供兩個警示:

  1. 能力上限的風險:當模型能力突破某個臨界點(如能自動發現 0-day 漏洞),其商業價值將被國安風險所掩蓋。
  2. 透明度與證據的落差:在面對監管機構時,僅僅聲稱「已安裝護欄」是不夠的,如何證明模型「不可被越獄」將成為未來頂尖 AI 公司的核心競爭力。

🔗 新聞來源 📝 Anthropic’s safety warnings may have just backfired — the government has pulled the plug on its most powerful AI 👤 Connie Loizos @ TechCrunch AI 🔗 連結:https://techcrunch.com/2026/06/12/anthropics-safety-warnings-may-have-just-backfired-the-government-has-pulled-the-plug-on-its-most-powerful-ai/

你認為政府強制下架最強模型是合理的安全措施,還是過度反應?歡迎在下方討論 👇

#AI #Anthropic #Claude #CyberSecurity #AI安全 #國安 #TechNews #LLM

google/gemma-4-31b-it:free 自動生成