google-research/timesfm
https://github.com/google-research/timesfm📌 【Google Research】時間序列預測也進入「基礎模型」時代:TimesFM 2.5 正式開源
當我們在討論 LLM 改變文字生成時,時間序列預測(Time-series Forecasting)是否也能擁有同樣的「基礎模型」能力?Google Research 提出的 TimesFM 試圖證明:透過大規模預訓練,一個模型可以處理各種不同的時間序列數據,而不再需要為每個數據集從零開始訓練模型。
🤔 預測未來不再需要為每個任務重新訓練
傳統的時間序列模型通常針對特定數據集進行訓練,缺乏泛化能力。Google Research 這次推出的 TimesFM (Time Series Foundation Model),核心理念是建立一個「預訓練」的基礎模型,讓工程師能直接利用其預先學習的時序模式,快速應用於各種預測場景,大幅降低開發門檻。
🧪 採用 Decoder-only 架構,將時序預測視為「生成」問題
TimesFM 在 ICML 2024 發表,其技術亮點在於採用了與 GPT 類似的 Decoder-only 架構。它將時間序列預測視為一種生成任務,透過預訓練的大量數據,學習時間序列中的通用特徵。
目前的開源版本提供了完整的 Checkpoints(可透過 Hugging Face 下載),並提供了從 1.0 到 2.5 的迭代版本,讓開發者能根據需求選擇不同的模型版本。
🚀 TimesFM 2.5 的關鍵進化:更輕量、更長記憶
根據最新的更新紀錄,TimesFM 2.5 相比於 2.0 版本有顯著的性能優化,展現了典型的「用更少資源達成更好效果」的趨勢:
- 參數規模縮減:從 500M 降低至 200M 參數,推理效率顯著提升。
- 上下文長度暴增:Context length 從 2048 提升至 16k,能捕捉更長期的歷史趨勢與週期性。
- 回歸協變量支持:在 2.5 版本中重新加入了對 XReg (Covariates) 的支持,讓模型能考慮外部影響因素(如節日、天氣等外部變數)來提高預測精準度。
💡 從單純預測到「Agentic」的生態整合
TimesFM 不僅僅是一個模型,Google 將其深度整合進企業級工作流中,這讓它在實務應用上極具競爭力:
- 企業級部署:透過 BigQuery ML 提供可擴展的 SQL 查詢,以及 Vertex Model Garden 的 Dockerized endpoint,支持 Agentic calling(代理調用)。
- 開發者友善:支持透過 HuggingFace Transformers + PEFT (LoRA) 進行微調 (Fine-tuning),讓開發者能用極小成本將基礎模型適配到特定領域數據。
- Agent 支持:最新更新已加入對 Agents 的支持(參考 SKILL.md),意味著時序預測能力可以被整合進更複雜的 AI Agent 工作流中。
⚠️ 開源版本非官方支持產品,部署需注意
需要注意的是,GitHub 上的這個開源版本被標記為「非官方支持的 Google 產品 (not an officially supported Google product)」。這意味著在生產環境部署時,開發者需自行承擔穩定性測試,而非依賴 Google 的官方 SLA 保證。
🎯 實務啟示:時序預測的開發範式正在轉移
對於 AI 工程師來說,TimesFM 的出現意味著開發流程的改變:
- 從「特徵工程 $\rightarrow$ 訓練」轉向「選擇基礎模型 $\rightarrow$ 微調 (LoRA) $\rightarrow$ 部署」。
- 如果你的業務涉及大量時序數據(如需求預測、金融分析、設備監控),嘗試使用預訓練模型進行 Zero-shot 預測,再搭配 LoRA 微調,將比傳統方法快得多。
🔗 資源連結 📝 論文:A decoder-only foundation model for time-series forecasting (ICML 2024) 💻 GitHub:https://github.com/google-research/timesfm 📦 模型權重:Hugging Face Collection
你認為「基礎模型」會完全取代傳統的時序預測模型(如 ARIMA 或 Prophet)嗎?歡迎在下方分享你的看法 👇
#GoogleResearch #TimesFM #TimeSeries #MachineLearning #FoundationModel #AI #時序預測 #ICML2024
由 google/gemma-4-31b-it:free 自動生成