ChatPaper/Information Retrieval Alibaba Group; Beijing University ★ 119 3 min

From Head to Tail: Asymmetric Knowledge Transfer in Long-tail Recommendation with Generative Semantic IDs

cs.IR

🔗 https://arxiv.org/abs/2605.23310

📌 【阿里巴巴】From Head to Tail:語義ID提升長尾推薦

隨著電商平台商品種類爆炸,頭部商品擁有豐富行為數據,而尾部商品卻因樣本稀少難以建立有效表示。傳統方法常嘗試把多模態特徵與協同訊號結合,卻忽略了一個關鍵事實:尾部的雜訊反而會損害頭部表示的學習。

🤔 你以為更多數據就能解決長尾問題?實際上,尾部雜訊反而會傷害頭部表現

這種非對稱的知識傳輸問題促使研究者思考:是否能讓頭部的穩定知識安全地流向尾部,同時避免尾部噪聲回流?

🧪 基於多模態LLM生成語義ID的端到端框架

AKT‑Rec 首先使用經監督微調的多模態LLM(MLLM)將商品和使用者的內容特徵與協同訊號對齊,得到連續的語義表示。接著透過Residual‑Quantized VAE(RQ‑VAE)將這些表示離散化為語義ID,形成語義聚類。

🔑 Cluster‑Guide適應性嵌入與非對比對齊
該框架把每個ID的表示分解為聚類級嵌入(捕捉共享語義)與個體嵌入。透過非對比對比目標和活動感知的門控機制,知識被有方向地從頭部ID傳遞至尾部ID,而尾部的噪聲被門控機制抑制。

🔗 階層特徵聚合與自適應融合
為了應對不同活動程度的樣本,AKT‑Rec 建立平行的特徵視圖,並依樣本活動度自適應地融合這些視圖,以優化預測。

📈 離線指標顯著提升,線上實驗驗證產業價值
在大規模工業數據集上的離線實驗顯示,AKT‑Rec 使AUC提升0.35%,GAUC提升1.53%,優過多個基線。在阿里巴巴Tmall平台的線上A/B測試中,CTR提升2.76%,GMV提升3.47%,說明該方法在真實生產環境中具有顯著商業價值。

💡 知識傳輸的非對稱性是關鍵設計
研究指出,頭部商品的表示較為穩定且富含協同訊號,適合作為知識來源;尾部商品則容易受樣本稀少導致的噪聲影響。透過聚類級嵌入捕捉共享語義,並讓門控機制依據活動度調整頭部知識對尾部的貢獻,模型得以在保護頭部品質的同時,提升尾部的表示質量。

⚠️ 需多模態LLM微調與RQ‑VAE,實作複雜度較高
評論中指出,AKT‑Rec 的實現依賴於對多模態LLM進行監督微調以及使用Residual‑Quantized VAE,這在工程落地時會增加訓練資源與模型部署的開銷。

🎯 對工程師的啟示:以語義ID為橋樑,非對稱傳輸可平衡頭尾表現

  • 在長尾場景中,先利用頭部的穩定訊號建立語義聚類,再透過非對比目標將知識方向性地導向尾部。
  • 活動感知門控可自適應抑制尾部噪聲對頭部的回流,提升整體穩定性。
  • 若資源允許,投入多模態LLM的微調與RQ‑VAE構建將是提升尾部商品表示的有效途徑。

🔗 論文連結
📝 From Head to Tail: Asymmetric Knowledge Transfer in Long-tail Recommendation with Generative Semantic IDs
👤 Chenyi Yan, Ruocong Tang, Xing Fang, Yang Huang, He Guo @ Alibaba Group; Beijing University
🔗 論文:https://arxiv.org/abs/2605.23310

你在處理長尾推薦時,是否也嘗試過利用頭部知識來補強尾部?歡迎在留言區分享你的經驗與思考 👇

#AI #推薦系統 #長尾問題 #語義ID #多模態LLM #阿里巴巴 #CTR #GMV #機器學習 #産業應用

tencent/hy3-preview:free 自動生成