MarkTechPost ★ 97 4 min

Moonshot AI Releases Kimi K2.7-Code: a Coding Model Reporting +21.8% on Kimi Code Bench v2 Over K2.6

Agentic AIAI AgentsFor DevsLanguage ModelLarge Language ModelMachine LearningOpen SourceSoftware Engineering

🔗 https://www.marktechpost.com/2026/06/12/moonshot-ai-releases-kimi-k2-7-code-a-coding-model-reporting-21-8-on-kimi-code-bench-v2-over-k2-6/

📌 【Moonshot AI 最新發佈】Kimi K2.7-Code:1 兆參數 MoE 架構,專為長程軟體工程而生

當 AI 寫 Code 從「單次生成」演進到「Agentic 工作流」時,推理成本與 token 消耗成了開發者的最大痛點。Moonshot AI 最新發佈的 Kimi K2.7-Code 正試圖在提升性能的同時,解決這個「過度思考」的問題。

🤔 從「聊天機器人」轉向「軟體工程 Agent」

Kimi K2.7-Code 的定位非常明確:它不是一個通用聊天模型,而是一個專注於長程軟體工程 (long-horizon software engineering) 的 Agentic 模型。它被設計用來處理需要多步驟規劃、編輯、調用工具以及反覆除錯的複雜任務,而非簡單的問答。

🧪 1 兆參數的 MoE 巨獸:技術規格解析

這是一個典型的伺服器級模型,其架構設計展現了極高的複雜度,不適合筆電運行,而是針對大規模部署設計:

  • MoE 架構:總參數 1T (1 兆),但每次 token 僅激活 32B 參數。
  • 專家設計:包含 384 個專家,每 token 選擇 8 個專家,並搭配 1 個共享專家。
  • 網路結構:共 61 層(含 1 個 dense layer),Attention 採用 MLA,前饋路徑使用 SwiGLU。
  • 多模態能力:內建 MoonViT 視覺編碼器 (400M 參數),可處理影像與影片輸入。
  • 部署規格:上下文窗口 256K tokens,原生提供 INT4 量化,模型權重約 595 GB。

🚀 Kimi Code Bench v2 提升 21.8%,且更「精簡」的思考過程

在性能對比中,K2.7-Code 在所有測試項均超越前代 K2.6,最顯著的提升在 Kimi Code Bench v2(從 50.9 升至 62.0)。而在與頂尖模型對比時,它在 MCP Mark Verified 上的表現 (81.1) 甚至超越了 Claude Opus 4.8 (76.4),並在 MLS Bench Lite 上逼近 GPT-5.5。

更關鍵的突破在於「推理效率」:Moonshot 報告其推理 token 的使用量比 K2.6 降低了約 30%。團隊將其定義為「減少過度思考 (less overthinking)」。

💡 為什麼「減少 30% 推理 token」對開發者至關重要?

在 Agentic coding 的場景中,AI 需要執行數百甚至數千個步驟(規劃 $\rightarrow$ 嘗試 $\rightarrow$ 驗證 $\rightarrow$ 重試)。由於推理 token 通常按輸出 token 計費,每一次的思考成本在長程任務中會產生複利效應。

這 30% 的削減不僅是速度的提升,更直接降低了運行複雜軟體工程任務的總成本。

⚠️ 強制的思考模式與極高的部署門檻

儘管性能強悍,但 K2.7-Code 有兩個明顯的限制:

  1. 強制思考模式:Thinking mode 是強制開啟的,若嘗試禁用將會導致 API 報錯。
  2. 硬體需求極高:595 GB 的硬碟佔用與巨大的參數規模,意味著這是一個純粹的伺服器級模型,對私有化部署的硬體要求極高。

🎯 實務啟示:關注 Agentic 工作流的成本優化

對於 AI 工程師而言,K2.7-Code 的發佈傳達了一個訊號:未來的 Coding 模型競爭將從「單次生成準確率」轉向「長程任務的推理效率」。

如果你正在構建自動化編程 Agent,除了追求模型能力,如何減少不必要的 reasoning tokens 將是降低成本、提升響應速度的關鍵。

🔗 相關資訊 📝 Moonshot AI Releases Kimi K2.7-Code 👤 報導:Asif Razzaq @ MarkTechPost 🔗 詳情:https://www.marktechpost.com/2026/06/12/moonshot-ai-releases-kimi-k2-7-code-a-coding-model-reporting-21-8-on-kimi-code-bench-v2-over-k2-6/ 📦 權重發佈於 Hugging Face (Modified MIT license) 🛠 支援 vLLM, SGLang, KTransformers 自行部署

你認為 AI 在寫 Code 時,「思考越多」就代表結果越好嗎?歡迎在下方討論 👇

#AI #Coding #MoE #MoonshotAI #KimiK2 #LLM #軟體工程 #AgenticAI

google/gemma-4-31b-it:free 自動生成