MarkTechPost ★ 23 4 min

Trajectory Releases a Concurrent Multi-LoRA Training Stack for Continual Learning, Reporting a 2.81× Experiment-Throughput Gain

Language ModelLarge Language ModelOpen SourceSoftware Engineering

🔗 https://www.marktechpost.com/2026/05/30/trajectory-releases-a-concurrent-multi-lora-training-stack-for-continual-learning-reporting-a-2-81x-experiment-throughput-gain/

📌 Trajectory 發布 Concurrent Multi‑LoRA 訓練堆疊,實驗吞吐提升 2.81×

你以為持續學習只能犧牲實驗速度?Trajectory 的最新場景報告顯示,他們的 Concurrent Multi‑LoRA (C‑LoRA) 堆疊在單租戶強化學習基線上實現了 2.81× 的端到端實驗吞吐提升,且未觀測到任何獎勵回報的退化。

🤔 傳統訓練週期漫長,持續學習卻需即時回饋
現在的語言模型多半採用「收集資料 → 訓練 → 發布」的斷跳式流程,從資料準備到模型上線常需數月。此種模式無法即時將產線上的使用者回饋或工程師的糾正轉為訓練信號,導致模型難以隨環境快速演進。Trajectory 想以持續學習取代這個週期,讓訓練成為線上系統的一部分。

🧪 以多租戶暖機引擎為基礎的 C‑LoRA 架構
Trajectory 與 UC Berkeley Sky Lab、Anyscale 合作,構建了一個 warm、multi‑tenant 引擎,在該平台上每個實驗都對應一個專屬的 LoRA 適配器。核心強化學習被拆解為三個基本 primitive:Sampler(從目前政策模型產生軌跡)、Trainer(計算梯度並更新權重)與 Parameter Synchronization(將更新廣播回推理工作站)。所有訓練程式碼已開源於 NovaSky-AI/SkyRL 倉庫。

🔬 核心發現:單租戶 RL 基線下,實驗吞吐提升 2.81×,且無獎勵回報退化
與傳統單租戶訓練框架相比,C‑LoRA 讓同樣硬體資源下的實驗數量提升了 2.81 倍。報告中特別強調,在這些提升的實驗中,未發現任何訓練獎勵的回歸(no regression on any training rewards),意味著效率提升並未犧牲學習品質。

💡 深入分析:透過專屬 LoRA 適配器消除冷啟動與資源重複初始化
團隊指出傳統堆疊存在四種主要低效率,其中首要問題是 「冷啟動緩慢」(每個序列任務都需要重新載入檢查點、初始化分散式執行階段)。透過將每個實驗映射到已預熱的多租戶引擎上的獨立 LoRA 適配器,C‑LoRA 避免了重複的檢查點載入與環境初始化,從而顯著縮短了每個實驗的準備時間,進而提升整體吞吐。

⚠️ 研究限制:僅報告端到端吞吐提升,未詳細說明長期穩定性與多任務干擾
目前的場景報告聚焦於實驗吞吐的量測與獎勵回報的穩定性,未提供長期持續學習的穩定性數據、不同任務間的干擾效應,或是在更大規模模型(例如 10B+ 參數)上的適用性評估。這些方面仍需後續工作進一步驗證。

🎯 實務啟示:採用暖機多租戶引擎與 LoRA 適配器可顯著加速持續學習實驗循環
對於需要快速迭代的 AI 產品(如程式碼輔助工具、客服代理等),採用類似 C‑LoRA 的架構可以:

  1. 減少實驗間的準備開銷,讓工程師能更頻繁地驗證新想法;
  2. 保持訓練品質,因為 LoRA 適配器在不改動基礎權重的前提下提供任務特定的更新;
  3. 利用線上互動作為訓練信號,使模型能即時從開發者糾正或客服介入中學習。

如果你正在評估持續學習方案,建議先嘗試在現有的 LoRA 工作流上加入暖機多租戶層,並參考 NovaSky‑AI/SkyRL 開源程式碼進行概念驗證。

🔗 論文連結
📝 Trajectory releases a concurrent multi‑LoRA training stack for continual learning, reporting a 2.81× experiment‑throughput gain
👤 Michal Sutter (MarkTechPost 報導)
🔗 報告:https://www.marktechpost.com/2026/05/30/trajectory-releases-a-concurrent-multi-lora-training-stack-for-continual-learning-reporting-a-2-81x-experiment-throughput-gain/
💻 程式碼:https://github.com/NovaSky-AI/SkyRL

你的團隊是否已經在嘗試類似的暖機多租戶訓練方式?歡迎在留言區分享經驗或疑問 👇

#Trajectory #LoRA #ContinualLearning #ReinforcementLearning #AI #UCBerkeley #Anyscale #NovaSkyAI #SkyRL #MachineLearning

tencent/hy3-preview:free 自動生成