2026-05-30 · Liquid AI reveals 8B-A1B MoE trained on 38T

📌 LFM2.5-8B-A1B：上下文擴至128K，詞彙倍增的邊緣推理模型

你以為更大的模型一定需要更強的硬體嗎？Liquid AI 的新作證明，僅靠擴展上下文與詞彙，就能在筆電上完成複雜工具鏈推理。

🤔 邊緣場景對模型尺寸與資源的雙重挑戰
隨著 AI 工具逐漸筆記型電腦、手機等消費級硬體普及，開發者需要既能在有限運算預算下運行，又能處理長文件、多語言內容的模型。過大的模型會導致延遲或無法部署；過小的模型則難以勝任複雜的工具鏈與推理任務。此時，如何在不增加硬體門檻的前提下提升模型的實用能力，成為一個重要的研究題目。

🧪 在 LFM2-8B-A1B 基礎上進行三項擴充

上下文視窗：從 32,768 tokens 擴展至 128,000 tokens，使模型能一次讀取更長的文檔或進行更長的推理鏈。
詞彙表大小：從 65,536 增加至 128,000，特別是為了改善非拉丁語言（如印地語、泰文、越南文、印尼語、阿拉伯文）的分詞效率。
預訓練規模：訓練 token 數從 12T 提升至 38T，並加入大規模強化學習，使模型在工具呼叫與鏈式任務上更為穩定。
架構上仍保留 MoE（混合專家）、GQA 與 gated short convolution 區塊，唯一的功能變化是該版本為 純推理模型：在給出最終答案前會先產生明確的思考鏈（chain‑of‑thought），這正是為了適應 MoE 在運算受限環境下、只有少數激活參數可用的特性。

🔑 可直接在消費級硬體上運行的特性
根據官方說明，基礎版（LFM2.5-8B-A1B-Base）與後訓練版（LFM2.5-8B-A1B）皆已開放在 Hugging Face 以及 Liquid AI Playground 下載。隨附的文件說明了如何在本地筆電上執行與微調，強調即使是入門級筆記型電腦也能夠鏈結多個工具呼叫並完成任務。

⚠️ 已公開的限制與適用範圍

目前的說明僅著重於模型的結構訓練規模與功能特性，未提供具體基準測試數據（如準確率、延遲等），因此無法直接比較在特定任務上的表現。
模型被定義為「純推理」版本，主要設計目的是在給出答案前產生思考鏈；若應用場景不需要此步驟，可能需要額外的後處理。
所有技術細節皆來自官方部落格與 Hugging Face 頁面，未涉及未在原文中提及的基準測試、消耗能源或細部超參數。

🎯 對工程師的實務建議

若你的產品需要在筆電或邊緣設備上執行長文件理解、多語言處理或工具鏈推理，LFM2.5-8B-A1B 提供了一種在不增加硬體成本下擴充上下文與詞彙的可行方案。
由於模型已開放權重，可直接在本地進行微調，以適應特定領域的工具呼叫流程。
在評估時，建議先在目標硬體上測試實際延遲與記憶體佔用，再根據具體任務需求決定是否啟用其思考鏈功能。

🔗 論文連結
📝 LFM2.5-8B-A1B：Edge Model for Fast, Reliable Tool Calling on Consumer Hardware
👤 Liquid AI 團隊（由 simjnd 在 Hacker News 分享）
🔗 部落格：https://www.liquid.ai/blog/lfm2-5-8b-a1b
🤗 Hugging Face：搜尋「LFM2.5-8B-A1B」即可取得權重與使用說明

你有在邊緣設備上部署過類似的 MoE 模型嗎？歡迎在留言區分享你的經驗或疑問 👇

#AI #LiquidAI #MoE #邊緣運算 #大語言模型 #開源模型 #HuggingFace #LLM #工具鏈 #推理模型 #多語言 #消費級硬體

同來源相關文章