西浦、利物浦大學提出：點雲數據增強首個全面綜述

2024-05-14科技

來源：機器之心Pro

AIxiv專欄是機器之心釋出學術、技術內容的欄目。過去數年，機器之心AIxiv專欄接收報道了2000多篇內容，覆蓋全球各大高校與企業的頂級實驗室，有效促進了學術交流與傳播。如果您有優秀的工作想要分享，歡迎投稿或者聯系報道。投稿郵箱：liyazhou @jiqizhixin .com；zhaoyunfeng @jiqizhixin .com

本論文的第一作者朱欽峰是西交利物浦大學和利物浦大學聯合培養的一年級在讀博士，其導師為範磊副教授。他的主要研究方向為語意分割、多模態資訊融合、3D視覺、高光譜影像和數據增強。該課題組正在招收24/25級博士生，歡迎郵件咨詢。

郵箱：qinfeng.zhu21 @student .xjtlu.edu.cn

主頁： https://zhuqinfeng1999.github.io/

本文是對發表於模式辨識領域頂刊Pattern Recognition 2024的最新綜述論文：「Advancements in Point Cloud Data Augmentation for Deep Learning: A Survey 」的解讀。

該論文由西交利物浦大學朱欽峰、範磊和翁寧馨完成。

這篇綜述首次全面總結了點雲數據增強的相關研究工作。

深度學習已成為點雲分析任務（如檢測、分割和分類）的主流和有效方法之一。為了減少在訓練深度學習模型過程中的過擬合，特別是在訓練數據量或多樣性有限的情況下提高模型效能，數據增強通常是關鍵。盡管各種點雲數據增強方法已在不同的點雲處理任務中廣泛套用，但目前尚未釋出這些方法的系統性綜述或討論。

因此，本文對這些方法進行了調研，將其分類到一個包含基礎和特定點雲數據增強方法的分類框架中。透過對這些增強方法的全面評估，本文確定了它們的潛力和局限性，為選擇合適的增強方法提供了有用的參考。

此外，本文還探討了未來研究的潛在方向。本調研有助於提供點雲數據增強當前研究的全面概覽，促進其更廣泛的套用和發展。

Free Access: https://authors.elsevier.com/c/1j3TW77nKoLGM

arXiv：https://arxiv.org/pdf/2308.12113

作者主頁：https://zhuqinfeng1999.github.io/

圖1.點雲數據增強方法的分類。

點雲數據增強

在深度學習領域，當可用的訓練數據集有限時，數據增強常被使用。這涉及執行一系列特定的操作來修改或擴充套件原始數據，從而增加數據集的數量和多樣性。

由於優質的增強數據集有助於提高網絡的魯棒性、增強泛化能力並減少過擬合，因此在訓練深度學習網絡時，數據增強幾乎總是被視為理想的選擇。在影像數據增強和文本數據增強領域，已經觀察到了全面的發展。

在眾多近期發表的關於點雲處理任務的研究論文中，研究人員探索了各種增強點雲數據的方法。這些方法的廣泛範圍為研究者在選擇合適的方法時帶來了挑戰。因此，系統地調查這些方法並將它們分類成不同組別具有重要價值。

本文呈現了一個關於點雲數據增強方法的全面調查。

基於我們的調查，我們提出了一個這些增強方法的分類體系，如圖1所示。

增強方法可以被分為兩個主要類別：基礎點雲增強和特定點雲增強，這與影像增強的典型分類方法相似。

基礎點雲增強指的是那些概念簡單且在不同任務和套用環境中具有普適性的方法，這一點透過它們在調查文獻中與其他方法的廣泛結合使用得到了證明。

特定點雲增強則指通常為解決特定挑戰或應對特定套用環境而開發的方法。在大多數情況下，特定點雲增強在計算上比基礎增強更為復雜，這取決於增強方法的實作細節。我們提出的分類體系中的子類別別代表了文獻中已用於點雲數據增強的各種方法的總結，或具有潛力被用於點雲數據增強的方法。

該綜述的主要貢獻如下：

這是第一篇全面調查點雲數據增強方法的綜述，涵蓋了點雲數據增強的最新進展。根據增強操作的特質，我們提出了一個點雲數據增強方法的分類體系。

本研究總結了各種點雲數據增強方法，討論了它們在典型的點雲處理任務（如檢測、分割和分類）中的套用，並為未來的潛在研究提供了建議。

基礎點雲增強

仿射變換涉及到仿射空間的變換，它保留了共線性和距離比例。在影像數據增強中，常用的仿射變換方法包括縮放、平移、旋轉、翻轉和剪下。同樣地，仿射變換也可以套用於點雲數據增強。典型的方法包括平移、旋轉、翻轉和縮放，並且這些方法已被廣泛用於生成額外的新訓練數據。

這些操作可以套用於整個點雲數據集，也可以使用特定策略套用於點雲數據中選定的例項（例項指的是諸如圖2（a）所示的車輛這樣的語意物件），或者套用於選定例項的特定部份。

但是，透過仿射變換增強的數據可能面臨資訊遺失或語意不合理的問題。這些仿射變換的具體操作及其討論詳見論文。

圖2.透過仿射變換增強點雲數據的範例:(a)原始點雲數據，(b)平移車輛，(c)旋轉車輛，(d)縮放車輛，(e)翻轉場景。

丟棄增強是指丟棄點雲數據中的一些數據點，如圖3所示。去除點的選擇是由具體策略決定的。丟棄的點可以是整個點雲數據的一部份，也可以是場景中隨機選擇的點。丟棄增強有助於深度學習模型對表示遮擋或部份可見場景的缺失或不完整數據變得更加魯棒。

它還可以防止深度學習模型過於依賴訓練數據集中的特定數據點。然而，遺失過多或關鍵的點雲資訊可能會導致訓練數據中對現實世界物件的不真實表示，並影響深度學習模型的訓練。基於丟棄增強的各種方法和討論詳見論文。

圖3.透過丟棄增強的點增強範例:(a)原始點雲數據，(b)隨機丟棄的增強點雲，(c)丟棄部份的增強點雲。

抖動是指對點雲中單個點的位置施加微小的擾動或雜訊，如圖4所示。基於抖動增強的各種方法和討論詳見論文。

圖4.抖動增強範例:(a)原始點雲數據，(b)抖動增強的點雲數據。

在場景級的點雲數據集中，例如戶外自動駕駛場景，標註的例項通常是有限的。在這種情況下，GT-sampling成為一種簡單而有效的數據增強方法。

GT-sampling是指將帶有標簽的例項添加到訓練數據集中的操作，如圖5所示，標記的GT例項來自同一訓練數據集或其他數據集。GT-sampling通常適用於場景級點雲數據集，而通常不考慮例項級點雲數據集，如ShapeNet。基於GT-sampling增強的各種方法和討論詳見論文。

圖5.(a)語意合理的GT-sampling，添加的車輛在紅框中。(b) 語意不合理的GT-sampling，一輛車在建築物墻體內，另一輛在樹木中。

除此以外，本文還介紹了套用於基礎點雲數據增強方法的策略，如Patch-based策略，和自動最佳化策略（見圖6）。本文對典型的基礎點雲增強方法進行了匯總，如表1所示。

圖6.自動最佳化的常見過程。

表1.代表性基礎點雲增強方法。

特定點雲增強

特定點雲增強方法通常旨在解決特定的挑戰或套用場景。特定點雲增強包括：Mixup增強，域增強，對抗性變形增強，上采樣增強，補全增強，生成增強，多模態增強和其他。

這些特定增強方法的具體定義以及討論詳見文中。表2概述了具有代表性的特定增強方法的發展，提供了各種資訊。

表2.代表性特定點雲增強方法。

需要註意的是，目前一些對抗性變形、上采樣、補全和生成技術並沒有直接套用到點雲數據增強中，如表3所示。為了對特定方法進行全面的分類，本文還包括了這些潛在的方法並對其進行了討論。

表3.潛在的特定點雲增強方法。

討論

論文中對點雲數據增強方法的適用任務以及場景進行了詳細的討論，並指出了點雲數據增強在一致性學習中的作用，如圖7所示。

圖7.(a)常規的深度學習訓練，將原始數據和增強數據發送到深度學習網絡進行訓練，得到訓練後的模型;(b)一致性學習，透過各種增強方法對輸入點雲數據進行變換，生成多個增強變量，然後將其饋送到多個網絡進行一致性學習，在訓練期間做出一致的預測。

表4對進行數據增強前後進行定量評估的文獻進行了整理，展示了數據增強的效果。作為比較各種增強方法的另一部份，附錄中（詳見論文）還概述了使用增強點雲數據的下遊任務的定量效能，以及這些任務中采用的增強方法。

表4.點雲數據增強對於增強模型表現的匯報結果。

未來工作

研究團隊針對該領域，指出了進一步研究的九點可能的方向：

研究人員沒有充分研究進行點雲數據增強的對抗性變形、上采樣、補全和生成。鑒於GAN和擴散模型的進步，這些模型可用於生成現實和多樣化的點雲例項。未來的研究應該在特定點雲處理任務的基準數據集上評估這些方法，以評估它們作為增強技術的有效性。

目前，很少有研究針對不同的點雲處理任務，使用一致的基線網絡和數據集來評估點雲數據增強方法的效能。這樣的評估將增強我們對不同增強方法效能的理解。因此，未來的研究工作可能側重於建立新的方法、指標和/或數據集，以評估點雲數據增強方法的有效性及其對深度學習模型效能的影響。

當套用於大規模點雲數據集時，某些特定增強方法可能會導致計算成本高昂。未來的工作可以集中在開發有效的演算法，在計算成本和增強效率之間進行權衡。此外，一些特定點雲增強方法相對復雜，難以復現。建議開發隨插即用方法，促進其廣泛采用。

對於點雲數據增強，缺乏普遍接受的基本增強操作組合。因此，未來的工作需要建立一個標準協定，在不犧牲增強效率的情況下，為不同的套用領域、任務和/或數據集選擇增強操作。

透過增強生成的多個點雲變體會影響一致性學習的有效性。目前，據我們所知，一致性學習中只使用了基本的增強方法。探索特定點雲增強方法，如對抗變形和生成增強，為提高一致性學習的有效性提供了一種有趣的方法，被認為是一個有價值的未來研究方向。

目前，將基礎點雲增強方法與特定點雲增強方法相結合的研究有限。這樣的組合有可能進一步增加數據增強的多功能性，值得未來的研究。

增強需要真實地模擬點雲數據的變化，如物體大小、位置、方向、外觀和環境的變化，以確保模擬數據與現實世界的情況保持一致，並保持語意正確。未來的研究可以著眼於標準化各種增強範圍，以適應特定的套用場景。

某些套用，如目標檢測，可能涉及場景中的動態物體。在動態環境中捕獲的點雲可能需要考慮物體時間變化的特定增強策略。例如，可以設計運動物體的特定軌跡，這可以透過一組組合增強操作來實作，例如平移，旋轉和丟棄。

ViT在簡單組合基本操作的情況下，在分割和分類任務上也取得了較強的效能。當與最先進的ViT作為骨幹網絡整合時，探索增強方法的效能將是有意義的。

參考文獻：

[1] Qinfeng Zhu , Lei Fan , Ningxin Weng , Advancements in Point

Cloud Data Augmentation for Deep Learning: A Survey, Pattern Recognition (2024), doi:

https://doi.org/10.1016/j.patcog.2024.110532