2026-06-18 · GLM-5.2 is probably the most powerful text-only open weights LLM

📌 【Z.ai 最新發布】753B 參數怪獸 GLM-5.2：目前最強的純文字開源權重模型？

當大多數開源模型在追求「輕量化」與「端側部署」時，中國 AI 實驗室 Z.ai 選擇走極端路線，直接釋出一個 1.51TB 的權重巨獸。

這不只是一個參數規模的競賽，更是在開源社群中罕見地將 753B 級別的 Mixture-of-Experts (MoE) 模型完全開放，這將如何改變我們對開源 LLM 上限的認知？

🤔 開源權重與封閉權重的權力移轉

長期以來，頂尖性能的模型（如 GPT-4 或 Claude 3.5）大多被封閉在 API 之後。Z.ai 的這次動作非常激進：GLM-5.2 在 6 月 13 日先提供給訂閱用戶，隨後在 6 月 16 日立即以 MIT 授權（MIT license）公開所有權重。

這意味著工程師與研究者現在可以跳過 API 限制，直接在自有基礎設施上部署、研究並微調這個等級的模型，對於追求數據隱私與高度自定義的企業來說，這是一個巨大的轉折點。

🧪 753B 參數與 MoE 架構的資源挑戰

GLM-5.2 的規格堪稱「怪物級別」：

這種設計在維持極高模型容量（Capacity）的同時，試圖透過 MoE 降低推理時的計算開銷。但對於部署者而言，1.51TB 的權重意味著極高的 VRAM 門檻，除非擁有頂級的 H100 集群或極其高效的量化方案，否則單機部署幾乎是不可能的任務。

🚀 上下文窗口從 20 萬暴增至 100 萬

除了規模，最顯著的進步在於對長文本的處理能力。GLM-5.2 的上下文窗口 (Context Window) 從 GLM-5.1 的 200,000 tokens 提升到了 1,000,000 tokens。

這意味著它能一次處理約 100 萬個 token 的資訊量。對於需要分析超長文檔、整個程式碼庫 (Codebase) 或大規模法律文件的應用場景，這將大幅減少對 RAG (檢索增強生成) 的依賴，讓模型能直接在上下文中處理海量資訊。

⚠️ 純文字導向，視覺能力需依賴獨立模型

需要注意的是，GLM-5.2 是一個「純文字輸入 (Text-only)」模型。雖然 Z.ai 擁有強大的視覺模型家族（如 GLM-5V-Turbo），但視覺模型目前並未採取開源權重策略。因此，如果你需要多模態能力，仍需透過 Z.ai 的其他產品線，無法單靠 GLM-5.2 完成。

🎯 工程實踐：部署挑戰與測試方向

對於 GenAI 工程師，這款模型的到來帶來了幾個實踐方向：

🔗 資訊來源 📝 GLM-5.2 is probably the most powerful text-only open weights LLM 👤 Simon Willison 🔗 文章：https://simonwillison.net/2026/Jun/17/glm-52/

面對這種 1.51TB 的權重巨獸，你會嘗試部署它，還是傾向於使用更輕量的小模型？歡迎在評論區分享你的看法 👇

#AI #LLM #OpenWeights #GLM52 #Zai #MoE #MachineLearning #開源模型

同來源相關文章