Towards a General Intelligence and Interface for Wearable Health Data
https://arxiv.org/abs/2605.22759📌 【Google DeepMind】穿戴健康數據的通用智能模型
🎣 你以為穿戴裝置只能記心跳?一個訓練於五百萬人、一兆分鐘的模型,竟能讓醫生也讚不絕口。
🤔 穿戴感測器資料難以直接轉換為健康洞察
雖然可穿戴設備蒐集了豐富的行為與生理訊號,但要把低階感測器數據轉換成能描述較高層次健康狀態的表示卻充滿挑戰。個體在基礎健康、生理與生活習慣上的巨大差異,使得同一種訊號在不同人身上可能代表完全不同的意義。此外,取得帶有健康結果標註的可穿戴資料成本高且耗時,回溯式標註幾乎不可行,導致高品質標註資料極為稀缺。
🧪 以超大規模未標註訊號預訓練基礎模型,並用 LLM 代理自動搜尋預測頭
研究團隊在來自五百萬參與者的超過一兆分鐘未標註感測器訊號上進行預訓練,建立一個穿戴健康基礎模型。他們發現模型容量與預訓練資料量的聯合縮放能在涵蓋心血管、代謝、睡眠、心理健康以及生活型態與人口統計因素的 35 項健康預測任務上帶來系統性提升。為了進一步利用這些表示,他們部署了一個「教室」規模的 LLM 代理,讓這些代理自行在模型嵌入上搜尋下游預測頭的空間,並觀察到伴隨 LLM 模型容量增加而提升的廣泛效能。最後,將這些下游預測頭整合到一個 Personal Health Agent 中,透過 1,860 份臨床醫師的評分驗證其回覆更具關聯性、情境意識與安全性。
💡 規模與代理協同產出標籤效率學習與生成能力
實驗顯示,隨著模型與資料規模的提升,基礎模型在各項健康任務上的表現持續改善。這種人口等級的表示不僅支援在極少標註資料下的 few‑shot 學習,還展現出生成每日健康指標的能力,使得模型能在缺乏標註的情況下仍能提供可靠的日常指標估計。LLM 代理驅動的預測頭搜尋過程減少了人工設計頭部的需求,並隨著使用更大的 LLM 而獲得更好的預測表現,顯示代理規模與模型效能之間的正相關關係。
⚠️ 僅以未標註資料預訓練,臨床驗證仍以評分為主
研究主要利用未標註的感測器訊號進行大規模預訓練,因此模型是否能直接捕捉特定疾病的細微生理變化仍需進一步驗證。評估僅涵蓋論文列出的 35 預設任務,未涵蓋所有可能的健康情境。臨床層面的驗證以 1,860 份醫師評分為依據,尚未進行真實世界的長期使用或醫療決策影響研究。此外,LLM 代理搜尋預測頭的計算成本可能對資源受限的環境造成挑戰。
🎯 為工程師與健康科技研究者提供低標註、可擴展的開發路徑
此工作表明,透過龐大未標註可穿戴資料預訓練的基礎模型,可大幅降低建構個人化健康預測所需的標註成本。工程師可直接在此基礎上進行 few‑shot 微調或利用其生成能力估計日常指標。健康科技研究者則可採用 LLM 代理自動搜尋預測頭的流程,快速原型化新的健康指標模型。最後,Personal Health Agent 的概念展示了如何將模型輸出與臨床安全性結合,為未來的 AI 醫療助理提供一個具體方向。
🔗 論文連結
📝 Towards a General Intelligence and Interface for Wearable Health Data
👤 Girish Narayanswamy, Maxwell A. Xu, A. Ali Heydari, Samy Abdel-Ghaffar, Marius Guerard (Google Research; Google DeepMind; University of Washington; University of Oregon; University of Illinois Urbana-Champaign)
🔗 https://arxiv.org/abs/2605.22759
你認為這種大規模未標註預訓練 + LLM 代理搜尋的組合,會在哪些穿戴健康應用中先發揮效果?歡迎在留言區分享你的見解 👇
#AI #Wearable #HealthTech #FoundationModel #LLMAgents #GoogleDeepMind #PersonalHealthAgent
由 tencent/hy3-preview:free 自動生成