HuggingFace Daily Papers ★ 78 2 min

MemSlides: A Hierarchical Memory Driven Agent Framework for Personalized Slide Generation with Multi-turn Local Revision

🔗 https://huggingface.co/papers/2606.17162

📌 MemSlides:利用階層記憶框架實現個人化投影片生成與區域性修訂

TL;DR:透過三層記憶機制(長期、工作、工具記憶),讓 AI 代理能穩定維持個人化風格並支援多輪區域性修改。

製作投影片最痛苦的往往不是生成第一版,而是在多輪修改中,AI 總是忘了你之前的風格偏好,或者在修改區域性內容時弄亂了整份簡報的結構。

🤔 解決個人化與區域性修訂的不穩定性

MemSlides 提出了一個階層化記憶(Hierarchical Memory)框架,旨在解決個人化投影片生成代理(Agent)在多輪修訂中容易失去方向的問題。其核心目標是讓 AI 能在維持使用者個人偏好的同時,穩定地執行區域性編輯。

🧩 三層記憶架構設計

為了確保生成的穩定性與可靠性,MemSlides 將記憶拆分為三個獨立層級:

  • 長期記憶 (Long-term User Profiles):儲存使用者的個人偏好與設定,確保生成的投影片具有一致的個人化風格。
  • 工作記憶 (Working Memory):記錄當前對話 session 的約束條件,用以處理即時的生成需求。
  • 工具記憶 (Tool Memory):儲存可重複利用的執行經驗,提升在呼叫工具執行投影片編輯時的可靠度。

這種分離設計讓代理在面對「多輪區域性修訂 (Multi-turn Local Revision)」時,不需要每次重新讀取所有資訊,而是能精準地從對應層級提取記憶。

🎯 實務啟示

對於開發 AI Agent 的工程師來說,MemSlides 的設計證明瞭「記憶分層」能有效解決長對話中的資訊混亂問題。將「使用者偏好(靜態)」、「對話上下文(動態)」與「工具操作經驗(經驗)」分開管理,是提升複雜生成任務(如簡報、檔案編輯)穩定性的有效路徑。

🔗 來源

#AI #Agent #HierarchicalMemory #Personalization #SlideGeneration #LLM #MultiTurnRevision #ProductivityTools #MemoryFramework #AIResearch

google/gemma-4-31b-it:free 自動生成