2026-06-02 · Alibaba’s Qwen Team Launches Qwen3.7-Plus, Adding Vision, Deep Reasoning, Tool Invocation, and Autonomous Iteration on the Bailian Platform

📌 【阿里巴巴 Qwen 團隊】Qwen3.7-Plus 上線：多模態理解＋自主迭代代理能力

你以為多模態模型只是看圖？
Qwen3.7-Plus 不僅讀圖，還能寫程式、調用工具、自己驗證並持續迭代。
這意味著模型從「回答」轉向「行動」，真正成為混合代理。

🤔 多模態理解是基礎，真正突圍在代理能力
Alibaba 的 Qwen3 系列已在 5 月發布 Qwen3.7 基礎版。此次釋出的 Qwen3.7-Plus 在該基礎上加入視覺理解，使模型能同時處理圖像、影片與文字提示。團隊將此定義為多模態混合代理技術的一步：模型不只產出答案，還能規劃與執行後續步驟。

🧪 在 Vision Arena 上的評測顯示競爭力
根據 LM Arena 所主導的 Vision Arena 頒獎，Qwen3.7-Plus-Preview 排名第 16 位，使阿里巴巴在視覺領域的實驗室排名躍升至第 5 名。這個中性榜單以雙盲對決方式衡量圖像理解答案的質量，結果顯示該模型在 OCR 大規模應用、圖表讀取或影像幀分析等圖像密集任務上具備可參考的實力。

💡 五項代理功能讓模型能自行迭代
Qwen3.7-Plus 在多模態理解之外，新增了以下能力：

深度推理：進行多步驟的邏輯推導。
自我編寫：模型能撰寫並修改自己的程式碼。
工具調用：呼叫外部函式或 API。
驗證與測試：執行輸出並檢查結果是否符合預期。
自主迭代：在任務未完成時自行重複上述步驟，直到達成目標。
這些功能共同描述了一個「能行動而不僅是回答」的模型。

⚠️ 主要限制：專屬 API 與評測範圍
該模型目前僅透過阿里雲 Bailian（國際版 Model Studio）以 API 形式提供，屬於專屬服務，即時開源復用受限。評測主要聚焦於 Vision Arena 的圖像理解基準，尚未公開廣泛的跨任務基準或長期使用效果數據。

🎯 適合雲端代理工作流的開發者
如果你的專案需要在阿里雲上處理圖像或影像，並希望模型能自行呼叫工具、執行程式碼並自我驗證，Qwen3.7-Plus 提供了一條可直接呼叫的路徑。建議先在 Bailian 平台上測試其 API，觀察深度推理與自主迭代在具體任務上的表現，再評估是否納入生產管線。

🔗 論文連結
📝 Alibaba’s Qwen Team Launches Qwen3.7-Plus, Adding Vision, Deep Reasoning, Tool Invocation, and Autonomous Iteration on the Bailian Platform
👤 Michal Sutter (MarkTechPost)
🔗 https://www.marktechpost.com/2026/06/02/alibabas-qwen-team-launches-qwen3-7-plus-adding-vision-deep-reasoning-tool-invocation-and-autonomous-iteration-on-the-bailian-platform/

你有在雲端平台上嘗試過模型自行調用工具或自我迭代的案例嗎？歡迎在留言區分享經驗 👇

#AI #Qwen #阿里巴巴 #多模態 #代理模型 #Bailian #視覺理解 #自主迭代 #MarkTechPost

同來源相關文章