GitHub Trending ★ 88 3 min

TencentCloud/TencentDB-Agent-Memory

TypeScript

🔗 https://github.com/TencentCloud/TencentDB-Agent-Memory

📌 【TencentCloud】TencentDB-Agent-Memory:用「符號化」與「分層記憶」解決 Agent Token 爆炸問題

TL;DR:透過符號化短期記憶與分層長期記憶,最高降低 61.38% Token 消耗並提升 51.52% 任務成功率。

在開發長對話 Agent 時,工程師常陷入一個矛盾:為了讓 AI 記得 SOP 和背景,必須餵入大量上下文,但這會導致 Token 消耗激增且雜訊增加,最終導致 Agent 在長程任務中迷失方向。

🧩 符號化短期記憶與分層長期記憶的設計理念

TencentDB-Agent-Memory 提出一套記憶管理機制,不再將所有資訊平鋪在 Context 中,而是將記憶拆分為兩種模式:

  • 符號化短期記憶(Symbolic Short-term Memory):將沉重的工具日誌(Tool Logs)壓縮成精簡的 Mermaid 符號。透過將詳細日誌「符號化」,大幅減少 Token 佔用,同時提升任務成功率。
  • 分層長期記憶(Layered Long-term Memory):捨棄傳統的扁平向量堆疊(Flat Vector Piles),將碎片化的對話提煉成結構化的「人物誌(Personas)」與「場景(Scenes)」。

📊 實測資料:大幅降低 Token 成本並提升成功率

當該記憶模組整合至 OpenClaw 時,在長程對話(Long-horizon sessions)的壓力測試下表現顯著:

測試場景成功率 (OpenClaw)成功率 (含 Plugin)相對提升 ($\Delta$)原 Token 消耗Plugin 後 Token相對減少 ($\Delta$)
WideSearch (短期)33%50%+51.52%221.31M85.64M-61.38%
SWE-bench (短期)58.4%64.2%+9.93%3474.1M2375.4M-33.09%
AA-LCR (短期)44.0%47.5%+7.95%112.0M77.3M-30.98%
PersonaMem (長期)48%76%+59%

值得注意的是,這些資料是在連續長程會話中測得,而非單次對話。例如在 SWE-bench 測試中,每個會話連續執行 50 個任務,用以模擬現實世界中 Agent 面對的上下文累積壓力。

💡 從「囤積」轉向「提煉」的記憶管理

該專案的核心觀點在於:記憶的目的不是將所有資訊塞進 AI,而是讓人類不需要重複解釋相同的 SOP、專案背景、工具慣例或輸出格式。透過將碎片資訊結構化,Agent 能更精準地提取有效資訊,而非在海量向量中搜尋。

🎯 實務啟示

對於開發複雜 Agent 的工程師,這提供了一個最佳化方向:不要試圖透過增加 Context Window 來解決記憶問題,而應思考如何將「日誌符號化」以及將「對話結構化」,將重複性的背景資訊從動態對話中抽離,轉化為靜態的結構化定義。

🔗 來源

#AI #LLM #Agent #MemoryManagement #TokenOptimization #TencentCloud #OpenClaw #ShortTermMemory #LongTermMemory #SoftwareEngineering

google/gemma-4-31b-it:free 自動生成