GitHub Trending Microsoft ★ 113 3 min

microsoft/agent-governance-toolkit

Python

🔗 https://github.com/microsoft/agent-governance-toolkit

📌 【Microsoft】Agent Governance Toolkit:讓自主 AI Agent 進入生產環境的治理框架

TL;DR:一套提供政策強制執行、身分識別與沙箱機制的工具套件,解決自主 Agent 的許可權控制與審計問題。

當 AI Agent 具備呼叫工具、瀏覽網頁、查詢資料庫甚至委派任務給其他 Agent 的能力時,一個嚴峻的問題隨之而來:一旦部署,它們將自主做出決定。如果你僅依賴 Prompt 層級的安全性(例如要求 AI 「請遵守規則」),這在本質上只是對一個隨機系統發出「禮貌請求」,而非真正的控制。

🤔 Prompt 安全性無法取代治理控制

Microsoft 指出,Prompt 注入(Prompt Injection)目前缺乏萬無一失的預防方法。引用 OWASP LLM01:2025 的觀點,以及 Andriushchenko 等人 (ICLR 2025) 的研究報告,部分系統的攻擊成功率甚至高達 100%。因此,僅靠 Prompt 設定無法作為有效的控制面。

🧩 解決自主 Agent 的三大核心痛點

Agent Governance Toolkit 旨在回答將 Agent 推向生產環境時最關鍵的三個問題:

  1. 行為許可權控制 (Policy Enforcement): 區分「能連線」與「能執行」。例如,一個擁有 send_emailquery_database 許可權的 Agent,不應該被允許執行 drop_table。單靠 OAuth 範圍 (Scopes) 或 IAM 角色只能控制 Agent 能接觸哪些服務,無法控制連線後具體做了什麼。

  2. 精確的身分識別 (Identity): 在多 Agent 系統中,多個 Agent 可能共用同一個 API 金鑰。當發生事故時,「某個 Agent 做了這件事」不足以作為有效的事故回應 (Incident Response),必須能精確追蹤是哪個特定 Agent 的行為。

  3. 不可篡改的審計紀錄 (Auditability): 為了滿足稽核與監管需求,系統必須提供防篡改的紀錄,詳細記錄每一次決策:當時啟用的政策為何、Agent 請求了什麼,以及允許或拒絕的理由。

🛠️ 工具特性與實作方向

該工具套件定位為生產等級的公共預覽版 (Public Preview),其核心設計理念包括:

  • 跨框架支援:透過單一 pip install 即可整合,不限於特定框架。
  • 治理維度:涵蓋政策強制執行 (Policy enforcement)、身分識別 (Identity)、沙箱機制 (Sandboxing) 以及針對自主 Agent 的 SRE 運維。

🎯 實務啟示

對於開發 AI Agent 的工程師而言,這提醒我們在設計系統時應將「治理」與「能力」分開。不要試圖透過最佳化 Prompt 來限制 Agent 的危險行為,而應在 Agent 外部建立一套獨立的治理層 (Governance Layer),將許可權檢查與審計日誌從 LLM 的隨機性中抽離,確保即使面對 Prompt 注入,系統底層仍有強制性的安全紅線。

🔗 來源

#AI #LLM #AIAgents #Governance #CyberSecurity #Microsoft #OpenSource #SRE #OWASP #AuditLog

google/gemma-4-31b-it:free 自動生成