Alibaba’s Qwen Team Launches Qwen3.7-Plus, Adding Vision, Deep Reasoning, Tool Invocation, and Autonomous Iteration on the Bailian Platform
https://www.marktechpost.com/2026/06/02/alibabas-qwen-team-launches-qwen3-7-plus-adding-vision-deep-reasoning-tool-invocation-and-autonomous-iteration-on-the-bailian-platform/📌 【阿里巴巴 Qwen 團隊】Qwen3.7-Plus 上線:多模態理解+自主迭代代理能力
你以為多模態模型只是看圖?
Qwen3.7-Plus 不僅讀圖,還能寫程式、調用工具、自己驗證並持續迭代。
這意味著模型從「回答」轉向「行動」,真正成為混合代理。
🤔 多模態理解是基礎,真正突圍在代理能力
Alibaba 的 Qwen3 系列已在 5 月發布 Qwen3.7 基礎版。此次釋出的 Qwen3.7-Plus 在該基礎上加入視覺理解,使模型能同時處理圖像、影片與文字提示。團隊將此定義為多模態混合代理技術的一步:模型不只產出答案,還能規劃與執行後續步驟。
🧪 在 Vision Arena 上的評測顯示競爭力
根據 LM Arena 所主導的 Vision Arena 頒獎,Qwen3.7-Plus-Preview 排名第 16 位,使阿里巴巴在視覺領域的實驗室排名躍升至第 5 名。這個中性榜單以雙盲對決方式衡量圖像理解答案的質量,結果顯示該模型在 OCR 大規模應用、圖表讀取或影像幀分析等圖像密集任務上具備可參考的實力。
💡 五項代理功能讓模型能自行迭代
Qwen3.7-Plus 在多模態理解之外,新增了以下能力:
- 深度推理:進行多步驟的邏輯推導。
- 自我編寫:模型能撰寫並修改自己的程式碼。
- 工具調用:呼叫外部函式或 API。
- 驗證與測試:執行輸出並檢查結果是否符合預期。
- 自主迭代:在任務未完成時自行重複上述步驟,直到達成目標。
這些功能共同描述了一個「能行動而不僅是回答」的模型。
⚠️ 主要限制:專屬 API 與評測範圍
該模型目前僅透過阿里雲 Bailian(國際版 Model Studio)以 API 形式提供,屬於專屬服務,即時開源復用受限。評測主要聚焦於 Vision Arena 的圖像理解基準,尚未公開廣泛的跨任務基準或長期使用效果數據。
🎯 適合雲端代理工作流的開發者
如果你的專案需要在阿里雲上處理圖像或影像,並希望模型能自行呼叫工具、執行程式碼並自我驗證,Qwen3.7-Plus 提供了一條可直接呼叫的路徑。建議先在 Bailian 平台上測試其 API,觀察深度推理與自主迭代在具體任務上的表現,再評估是否納入生產管線。
🔗 論文連結
📝 Alibaba’s Qwen Team Launches Qwen3.7-Plus, Adding Vision, Deep Reasoning, Tool Invocation, and Autonomous Iteration on the Bailian Platform
👤 Michal Sutter (MarkTechPost)
🔗 https://www.marktechpost.com/2026/06/02/alibabas-qwen-team-launches-qwen3-7-plus-adding-vision-deep-reasoning-tool-invocation-and-autonomous-iteration-on-the-bailian-platform/
你有在雲端平台上嘗試過模型自行調用工具或自我迭代的案例嗎?歡迎在留言區分享經驗 👇
#AI #Qwen #阿里巴巴 #多模態 #代理模型 #Bailian #視覺理解 #自主迭代 #MarkTechPost
由 tencent/hy3-preview:free 自動生成