GitHub Trending ★ 105 3 min

OpenPipe/ART

Python

🔗 https://github.com/OpenPipe/ART

📌 【OpenPipe】ART:開源 GRPO 框架搭配 W&B Serverless RL,讓多步驟 AI Agent 訓練更省錢更快

想訓練能執行多步驟任務的 LLM Agent,卻被 GPU 配置與基礎建設纏住?ART 宣稱只要幾行程式碼,就能交給 Weights & Biases 的 Serverless 服務處理,成本降 40%、速度提 28%。

多步驟 Agent 訓練的新選擇
ART 是 OpenPipe 開源的 RL 框架,專門讓大型語言模型透過 GRPO(Group Relative Policy Optimization)從經驗中學習,適用於任何 Python 應用,目標是提升代理在真實世界任務上的可靠性。

W&B Serverless RL 如何簡化基礎設施
與傳統的自建訓練流程不同,ART 配合 W&B 的 Serverless RL 服務,會自動管理訓練與推論所需的運算叢集。使用者只需定義資料、環境與獎勵函式,其餘的基礎建設、擴容與健康檢查全部由服務負責。

實際益處:成本降低 40%、訓練加速 28%、可擴至 2000+ 併發請求
根據專案說明,採用共享的生產級推論叢集可將費用下降約 40%;訓練速度則提升約 28%。服務支援橫向擴展至 2000+ 個併發請務,跨多個 GPU 運行,且每個檢查點都能透過 W&B Inference 即時取得。

程式碼範例展示

import art
from art.serverless import ServerlessBackend

model = art.TrainableModel(
    project="voice-agent",
    name="agent-001",
    base_model="OpenPipe/Qwen3-14B-Instruct"
)
backend = ServerlessBackend(api_key="your_wandb_api_key")
model.register(backend)
# 之後即可在分鐘內編輯、迭代,無需手動佈建 GPU

上述片段示範如何將模型註冊到 Serverless 後端,訓練與推論全程由 W&B 負責。

目前所知的限制與適用場景
repo 頁面未公開詳細的基準測試報告或已知限制說明。因此,ART 更適合用於快速原型、實驗與內部迭代;在考慮導入生產環境前,仍建議自行評估穩定性與長期成本。

實務建議
若您正在構建多步驟的 LLM 代理(例如語音助理、工作流自動化),可先在小規模任務上嘗試 ART 的 Serverless 後端,觀察訓練週期與費用變化。根據回饋再決定是否擴大投入或自行維護基礎設施。

🔗 原始碼與文件
👉 https://github.com/OpenPipe/ART

你有試過用 Serverless 方式訓練 AI Agent 嗎?歡迎在留言區分享經驗或疑問 👇

#AI #ReinforcementLearning #LLM #Agent #OpenPipe #WeightsAndBiases #GRPO #ServerlessRL #開源 #AI工程

tencent/hy3-preview:free 自動生成