HuggingFace Daily Papers ★ 93 2 min

DF3DV-1K: A Large-Scale Dataset and Benchmark for Distractor-Free Novel View Synthesis

🔗 https://huggingface.co/papers/2604.13416

📌 DF3DV-1K:為無干擾視角合成提供的大規模真實世界資料集

TL;DR:推出含 1,048 個場景的 DF3DV-1K 資料集,解決視角合成研究中缺乏「乾淨與雜亂」對比影像的問題。

在進行輻射場(Radiance Field)研究時,如何處理影像中的干擾物(distractors)一直是提升視角合成品質的痛點。若缺乏高品質的對比資料,模型很難學會如何將雜訊與目標物分離。

🤔 解決視角合成中「干擾物」的資料短缺

目前的輻射場研究缺乏能夠同時提供「乾淨(clean)」與「雜亂(cluttered)」影像集的真實世界資料集。為了填補這個缺口,研究者推出了 DF3DV-1K,旨在提供一個大規模的基準,讓模型能更有效地進行無干擾(distractor-free)的視角合成。

📊 1,000 個場景、近 9 萬張影像的規模

DF3DV-1K 提供了極其豐富的場景多樣性,具體數據如下:

  • 場景數量:共 1,048 個場景。
  • 影像總量:包含 89,924 張影像。
  • 多樣性:涵蓋 128 種干擾物類型以及 161 個場景主題。
  • 評估子集:另外提供一個精心策劃的 DF3DV-41 子集,專門用於評估模型的魯棒性(robustness)。

🧩 提升 2D 增強模型的微調效能

研究結果顯示,將 DF3DV-1K 用於微調基於擴散模型(diffusion-based)的 2D 增強器後,能有效提升輻射場方法的整體表現。這意味著透過高品質的對比資料訓練,模型能更好地在視角合成過程中剔除干擾,生成更乾淨的結果。

🎯 實務啟示

對於開發 NeRF 或 3D Gaussian Splatting 等輻射場技術的工程師來說,DF3DV-1K 提供了一個強大的基準。如果你正在開發影像預處理或 2D 增強管線,利用此類「乾淨 vs 雜亂」的對比資料集進行微調,將有助於提升模型在複雜真實場景中的去噪與合成能力。

🔗 來源

#3DV #NovelViewSynthesis #RadianceField #Dataset #DiffusionModel #ComputerVision #NeRF #ComputerGraphics #MachineLearning #DF3DV1K

google/gemma-4-31b-it:free 自動生成