Energy per Successful Goal: Goal-Level Energy Accounting for Agentic AI Systems
https://arxiv.org/abs/2605.22883📌 目標能耗新指標:EpG
你以為 AI 能耗只看單次推理就夠了?在複雜的 Agent 工作流中,這種算法可能嚴重低估真實成本。
🤔 單次推理能耗無法反映目標完成成本
現行 AI 能耗基準多以單次模型呼叫或訓練運行為單位。對於單輪任務這個單位仍具意義;但在 Agentic 系統中,一個使用者目標常會觸發多步 orchestration、工具呼叫、重試與失敗復原循環。此時呼叫次數只是實作細節,而非任務本身的屬性,導致以推理為基礎的能耗無法正確衡量目標完成的能源成本。
🧪 跨層能量測量框架 A-LEMS
論文提出 A-LEMS(Agentic LLM Energy Measurement System),一個跨層測量框架,把能耗的計量單位從「每次推理能耗」轉為「每成功目標能耗(EpG)」。EpG 會把工作流程中所有執行嘗試(包括失敗與重試)的總能耗加總,再以成功完成的目標數作正規化。該框架透過時間邊界模型、五層觀測管線(將 RAPL 訊號映射至工作流級能耗)以及一個將每次測量綁定至硬體與運行配置的可重複性協議來實現能量歸因。
Agentic 工作流每成功目標能耗是線性基準的 4.33 倍
在五種推理任務族群與三種工具增強任務族群的實驗中,Agentic 工作流的平均 EpG 為 888.1 J,而相同任務的線性基準僅為 205.3 J。這意味著 Agentic 執行每成功目標消耗的能量約為線性執行的 4.33 倍。這額外成分主要來自 orchestration 結構,而非推理計算本身。對於工具增強任務,Orchestration Overhead Index (OOI) 甚至低於 1.0,顯示在某些情況下 Agentic 執行反而更省能,進一步證實 OOI 捕捉的是 orchestration 的結構差異,而非一種固定的向上偏 bias。
💡 orchestration 結構是能耗主因,而非推理計算
進一步分析顯示,能耗差異的來源在於工作流的編排方式(如重試、分支、工具切換),而單次模型推理的能耗在兩種基準間相近。這意味著若想降低 Agentic 系統的能耗,優化 orchestration(減少不必要的重試、精簡工具調用、改善失敗恢復機制)比單純提升模型效能更具影響力。
⚠️ 僅在特定任務族群驗證,未涵蓋所有場景
實驗僅涵蓋五種推理與三種工具增強任務族群,未探索其他類型的 Agentic 工作流(例如多模態規劃、長期對話等)。因此,報告的 4.33 倍 overhead 可能在此些特定設定下具有代表性,但在更廣泛的應用中仍需進一步驗證。
🎯 EpG 與 OOI 為能效基準提供新基礎
對於工程師與研究者來說,EpG 與 OOI 提供了一種更貼近實際目標完成的能耗計量方式,可用於比較不同 orchestration 設計的能效。未來的基準報告若能同時提供 EpG 與 OOI,將有助於更正確地評估 Agentic AI 系統的能源效益,並引導架構設計往低 orchestration 開銷的方向演進。
🔗 論文連結
📝 Energy per Successful Goal: Goal-Level Energy Accounting for Agentic AI Systems
👤 Deepak Panigrahy, Aakash Tyagi (Independent Researcher; Texas A&M University)
🔗 論文:https://arxiv.org/abs/2605.22883
你在設計 Agentic 工作流時,有沒有留意 orchestration 能耗的影響?歡迎在留言區分享你的經驗與看法 👇
#AI #AgenticAI #能效 #EpG #OOI #研究論文 #TexasA&M #機器學習 #綠色AI
由 tencent/hy3-preview:free 自動生成