2026-06-29 · Unclecheng-li/VulnClaw

📌 VulnClaw：用自然語言驅動的 AI 滲透測試 Agent

TL;DR：整合 LLM Agent 與 MCP 工具鏈，將「資訊收集到報告生成」的滲透流程自動化。

傳統的滲透測試依賴安全工程師在大量工具（如 Nmap, Burp Suite）之間手動切換並分析結果。如果能用「人話」下指令，讓 AI 自動編排工具鏈並驗證漏洞，滲透測試的效率將發生質變。

🧩 以「目標驅動」取代固定工作流

VulnClaw 並非簡單的指令指令碼，而是一個可獨立執行的 AI Agent。它將滲透測試建模為從 origin（起點）向 goal（目標）的狀態空間搜尋，核心設計包含：

🛠️ 核心技術架構與工具鏈

VulnClaw 透過 LLM Agent 協調多方能力，實現從自然語言到實際攻擊的轉換：

MCP 工具鏈：整合 4 個 MCP 服務。fetch 與 memory 為本地實現；chrome-devtools 與 burp 則對接外部服務，實現瀏覽器自動化與 HTTP 抓包重放。
Skill 體系：內建 21 個滲透 Skill（7 個核心 + 14 個專項，涵蓋 Web/Crypto/Misc 等），並提供 180 個參考檔案。
精確操作工具：內建 29 種編解碼與加解密工具（如 Base64, AES, JWT 等），讓 LLM 透過精確呼叫而非猜測來處理資料。
自適應反思機制：將已知事實與攻擊鏈結構化沉澱，若攻擊失敗會自動歸類，並按 L0-L4 級別漸進式升級 payload 繞過策略。

📊 自動化滲透的四個階段

使用者僅需輸入如「幫我對 http://target.example.com 進行滲透測試」，Agent 將自動執行以下迴圈：

💡 靈活的模型支援與執行控制

廣泛的模型相容性：支援 13 個 LLM Provider（包含 OpenAI, DeepSeek, MiniMax 等），透過 OpenAI 相容協議與 Tool Calling 實現一鍵切換。
持續性測試：預設執行週期迴圈（100 輪/週期 × 10 週期），每週期自動生成報告直到手動終止。
執行環境：內建 python_execute 工具用於構造 payload 與解析響應（作者提醒此功能目前屬高風險實驗能力，非強隔離沙箱）。

⚠️ 適用場景與限制

本工具適用於已授權的滲透測試、CTF 競賽、安全教學及紅隊演練。使用者可透過 think on/off 切換是否顯示 LLM 的思考過程，以獲取乾淨的結論輸出。

🎯 實務啟示

對於安全工程師而言，VulnClaw 展現了「LLM Agent + 專業工具鏈」的整合潛力。其「證據級反幻覺」與「狀態空間搜尋」的設計，提供了將非結構化探索轉化為結構化攻擊路徑的參考實作，能大幅降低初步漏洞掃描與驗證的人力成本。

🔗 來源

#AI #LLM #PenetrationTesting #CyberSecurity #Agent #MCP #CTF #RedTeaming #Automation #VulnClaw

同來源相關文章