Liquid AI reveals 8B-A1B MoE trained on 38T
https://www.liquid.ai/blog/lfm2-5-8b-a1b📌 LFM2.5-8B-A1B:上下文擴至128K,詞彙倍增的邊緣推理模型
你以為更大的模型一定需要更強的硬體嗎?Liquid AI 的新作證明,僅靠擴展上下文與詞彙,就能在筆電上完成複雜工具鏈推理。
🤔 邊緣場景對模型尺寸與資源的雙重挑戰
隨著 AI 工具逐漸筆記型電腦、手機等消費級硬體普及,開發者需要既能在有限運算預算下運行,又能處理長文件、多語言內容的模型。過大的模型會導致延遲或無法部署;過小的模型則難以勝任複雜的工具鏈與推理任務。此時,如何在不增加硬體門檻的前提下提升模型的實用能力,成為一個重要的研究題目。
🧪 在 LFM2-8B-A1B 基礎上進行三項擴充
- 上下文視窗:從 32,768 tokens 擴展至 128,000 tokens,使模型能一次讀取更長的文檔或進行更長的推理鏈。
- 詞彙表大小:從 65,536 增加至 128,000,特別是為了改善非拉丁語言(如印地語、泰文、越南文、印尼語、阿拉伯文)的分詞效率。
- 預訓練規模:訓練 token 數從 12T 提升至 38T,並加入大規模強化學習,使模型在工具呼叫與鏈式任務上更為穩定。
架構上仍保留 MoE(混合專家)、GQA 與 gated short convolution 區塊,唯一的功能變化是該版本為 純推理模型:在給出最終答案前會先產生明確的思考鏈(chain‑of‑thought),這正是為了適應 MoE 在運算受限環境下、只有少數激活參數可用的特性。
🔑 可直接在消費級硬體上運行的特性
根據官方說明,基礎版(LFM2.5-8B-A1B-Base)與後訓練版(LFM2.5-8B-A1B)皆已開放在 Hugging Face 以及 Liquid AI Playground 下載。隨附的文件說明了如何在本地筆電上執行與微調,強調即使是入門級筆記型電腦也能夠鏈結多個工具呼叫並完成任務。
⚠️ 已公開的限制與適用範圍
- 目前的說明僅著重於模型的結構訓練規模與功能特性,未提供具體基準測試數據(如準確率、延遲等),因此無法直接比較在特定任務上的表現。
- 模型被定義為「純推理」版本,主要設計目的是在給出答案前產生思考鏈;若應用場景不需要此步驟,可能需要額外的後處理。
- 所有技術細節皆來自官方部落格與 Hugging Face 頁面,未涉及未在原文中提及的基準測試、消耗能源或細部超參數。
🎯 對工程師的實務建議
- 若你的產品需要在筆電或邊緣設備上執行長文件理解、多語言處理或工具鏈推理,LFM2.5-8B-A1B 提供了一種在不增加硬體成本下擴充上下文與詞彙的可行方案。
- 由於模型已開放權重,可直接在本地進行微調,以適應特定領域的工具呼叫流程。
- 在評估時,建議先在目標硬體上測試實際延遲與記憶體佔用,再根據具體任務需求決定是否啟用其思考鏈功能。
🔗 論文連結
📝 LFM2.5-8B-A1B:Edge Model for Fast, Reliable Tool Calling on Consumer Hardware
👤 Liquid AI 團隊(由 simjnd 在 Hacker News 分享)
🔗 部落格:https://www.liquid.ai/blog/lfm2-5-8b-a1b
🤗 Hugging Face:搜尋「LFM2.5-8B-A1B」即可取得權重與使用說明
你有在邊緣設備上部署過類似的 MoE 模型嗎?歡迎在留言區分享你的經驗或疑問 👇
#AI #LiquidAI #MoE #邊緣運算 #大語言模型 #開源模型 #HuggingFace #LLM #工具鏈 #推理模型 #多語言 #消費級硬體
由 tencent/hy3-preview:free 自動生成