當前位置: 華文世界 > 科技

SegAD:復雜工業影像的有監督異常檢測網路和數據集(CVPR2024)

2024-08-30科技

論文題目

Supervised Anomaly Detection for Complex Industrial Images

1、簡介

工業生產線的自動化視覺檢測對於提高各行業的產品品質至關重要,異常檢測(AD)方法是實作這一目的的強大工具。然而,現有的公共數據集主要由沒有異常的影像組成,限制了AD方法在生產環境中的實際套用。為了應對這一挑戰提出了(1)Valeo異常數據集(VAD),這是一個新的現實世界的工業數據集,包含5000張影像,包括2000個例項,這些例項跨越20多個子類別,具有挑戰性的真實缺陷,考慮到傳統的AD方法難以處理該數據集,引入(2)基於分割的異常檢測器(SegAD),SegAD利用異常對映和分段對映來計算本地統計資訊,SegAD使用這些統計數據和一個可選的監督分類器分數作為增強隨機森林(BRF)分類器的輸入特征,生成最終的異常分數。SegAD在VAD (+2.1% AUROC)和VisA數據集(+0.4% AUROC)上都達到了最先進的效能。

貢獻如下:

提出了一個具有復雜物件和大量缺陷的監督異常檢測數據集,建立了一個比目前大多數異常檢測基準更具挑戰性的單類異常檢測基準,一個具有大量用於訓練的壞影像(1000張)的監督基準和一個具有少量用於訓練的壞影像(100張)的監督基準。

建立了一種新的監督異常檢測方法,稱為SegAD,這種方法在保留檢測未知缺陷的能力的同時,明顯優於最近單獨的異常檢測器,SegAD在VAD和已建立的VisA數據集上都達到了SOTA結果。

2、背景

1)現有異常檢測數據集,MVTec AD主要由紋理和簡單缺陷組成的數據集相比,該數據集透過提供真實缺陷和逼真物體的影像,顯著提高了異常檢測方法。MVTec LOCO AD強調了邏輯缺陷的挑戰,例如缺失或錯位的部件,需要能夠捕獲影像全域上下文的異常檢測方法。VisA數據集在此基礎上進行了擴充套件,將具有復雜結構、多個例項和規模變化的不同物件納入其中。

現有數據集存在的問題:

現有數據集往往包含模擬缺陷,造成研究與實際套用之間的領域差距,這使得在現實環境中部署異常檢測方法變得復雜。另一個問題是數據集的飽和,基本已經很難提高。

本文思路:

為了促進監督異常檢測,提出了Valeo異常數據集(VAD),具有各種缺陷(包括邏輯缺陷)的真實工業數據集。數據集引入了更廣泛的具有挑戰性和多樣性的異常,以及良好影像的高類內變異性。

2)異常檢測方法,異常檢測有無監督和有監督方法,無監督只使用正常影像訓練,預測影像中的異常,有監督方法使用異常影像和正常影像一起訓練

無監督異常檢測,PatchCore依靠預訓練的特征提取器模型從訓練集中提取特征到記憶庫中,並使用coreset子采樣減小記憶庫的大小,從新輸入中提取的特征與記憶庫中最近的特征進行比較。FastFlow使用類似的特征提取器模型,並使用歸一化流將提取的特征對映到高斯分布。RD4AD采用師生架構,將多層特征提取器的特征結合在一起,消除冗余的特征。EfficientAD引入了許多創新,包括使用自動編碼器來檢測邏輯缺陷,作為經典師生架構的補充,以及他們自己的預訓練特征提取器,它以明顯更少的推理時間模仿更大模型的行為。

有監督異常檢測,理論上,利用缺陷部份進行訓練有利於細化類邊界,異常的小尺寸和不可能收集所有潛在的缺陷,最近的幾種異常檢測方法既使用好的影像,也使用壞的影像,但其中一些對看到的缺陷過擬合,而另一些則需要對缺陷進行像素掩模來計算損失或生成新的缺陷,這在現實世界中可能會出現問題。

3、Valeo異常數據集(VAD)

VAD由一個類組成,具有預定義的訓練集和測試集,訓練集包含1000張壞影像和2000張好影像,測試集包含1000張壞影像,其中165張是看不見的壞影像,1000張好影像。測試數據集中看不見的壞影像指的是幾種罕見的缺陷型別,這些缺陷型別在訓練數據中不存在,其中的幾個範例如圖4所示,擁有這樣的影像對於避免將異常檢測問題轉化為監督分類問題非常重要。由於拍攝的方式,有些影像可能在底部有一個薄的黑色邊框,如圖2所示。缺陷可能出現在影像的整個區域。雖然提供了影像級別的註釋,但是由於缺陷的復雜性以及缺少或放錯位置的元件沒有確切的位置,因此沒有像素級別的註釋。

4、異常檢測器(SegAD)

SegAD,我們的方法利用從一個或多個異常檢測器的分段輸出中提取的異常圖,在這些地圖上計算更高層次的統計特征,如偏度、峰度或平均值,以生成局部異常特征。SegAD提供了將監督分類器分數的輸出與局部異常特征結合使用的靈活性,為最終生成最終分數的增強隨機森林(boosting Random Forest, BRF)分類器建立輸入。

SegAD推理由管道中連續的三個階段組成,首先是異常圖計算和可選的監督分類器評分計算,接下來是計算單個區段上異常對映的簡單統計數據。最後,將獲得的統計數據以及分類器得分作為BRF分類器的輸入特征,以提供最終結果。

5、實驗

1)無監督方法在數據集(VAD)上檢測結果

1)有監督方法在數據集(VAD)上檢測結果

3)無監督和有監督方法在VisA 數據集上的檢測結果