2026-06-13 · Anthropic’s safety warnings may have just backfired — the government has pulled the plug on its most powerful AI

📌 【Anthropic 重大危機】安全警告反成導火線？美國政府強制下架最強模型 Claude Mythos 5

當 AI 的能力強到能發現所有主流作業系統的漏洞時，它究竟是防禦的利器，還是國安的威脅？Anthropic 這次的處境正說明了 AI 研發中「能力」與「安全」之間最激烈的衝突。

🇺🇸 政府強令下架：全球使用者同步失去存取權

美國政府於上週五正式下令，要求 Anthropic 立即關閉其兩款最強大模型 —— Claude Fable 5 與 Claude Mythos 5 的所有存取權。值得關注的是，這項指令並非僅針對出口管制中的特定外國國民，而是強制要求對「全球所有使用者」禁用。Anthropic 已確認配合執行，但明確表示政府此次的決定是錯誤的。

🛡️ 從 Project Glasswing 到 Fable 5 的策略佈局

這次被禁的兩款模型，代表了 Anthropic 對於「能力釋放」的不同策略：

Claude Mythos 5（最高能力版）：這是 Anthropic 最強的模型，因其能精準找出軟體安全漏洞的能力極其驚人（測試中發現了所有主流 OS 與瀏覽器的漏洞），因此公司採取極其嚴格的限制，僅透過「Project Glasswing」計畫開放給 Amazon、Apple、Google、Microsoft 及 CrowdStrike 等約 50 家經過審核的機構，用於防禦性資安工作。
Claude Fable 5（商用安全版）：為了回應商業壓力，Anthropic 在三天前推出了 Fable 5。這本質上是 Mythos 5 的「加裝護欄版」，旨在封鎖資安與生物學等高風險領域的回應，使其足以對大眾公開。根據 Vals AI 的基準測試，Fable 5 在發布之初即成為市面上最強的公開 AI 模型。

⚠️ 出口管制的名義 vs. 實際的「越獄」疑慮

雖然政府將此指令定調為「出口管制」行動，但 Anthropic 在部落格中揭露了更深層的矛盾：政府真正的擔憂在於 Fable 5 疑似被「越獄 (Jailbreak)」。然而，Anthropic 指出，截至目前為止，政府僅提供了口頭證據，並未提供實質證明 Fable 5 的安全護欄已失效。

💡 技術洞察：當 AI 發現漏洞的速度超過修補速度

這起事件揭示了一個 AI 時代的殘酷現實：當一個模型具備發現所有主流 OS 漏洞的能力時，即便設定了護欄，只要存在 1% 的越獄可能，該模型在政府眼中就從「資安工具」變成了「大規模攻擊武器」。

這也讓業界重新思考：對於具備極高破壞潛力的模型，單靠 Prompt-level 的護欄（Guardrails）是否足以說服監管機構？

🎯 實務啟示：AI 研發的「能力-安全」權衡

對於 AI 開發者與企業，這次事件提供兩個警示：

能力上限的風險：當模型能力突破某個臨界點（如能自動發現 0-day 漏洞），其商業價值將被國安風險所掩蓋。
透明度與證據的落差：在面對監管機構時，僅僅聲稱「已安裝護欄」是不夠的，如何證明模型「不可被越獄」將成為未來頂尖 AI 公司的核心競爭力。

🔗 新聞來源 📝 Anthropic’s safety warnings may have just backfired — the government has pulled the plug on its most powerful AI 👤 Connie Loizos @ TechCrunch AI 🔗 連結：https://techcrunch.com/2026/06/12/anthropics-safety-warnings-may-have-just-backfired-the-government-has-pulled-the-plug-on-its-most-powerful-ai/

你認為政府強制下架最強模型是合理的安全措施，還是過度反應？歡迎在下方討論 👇

#AI #Anthropic #Claude #CyberSecurity #AI安全 #國安 #TechNews #LLM

同來源相關文章