羅 瓊 韓 志 陳希愛 唐延東
1(中國科學院沈陽自動化研究所機器人學國家重點實驗室 遼寧 沈陽 110016) 2(中國科學院機器人與智能制造創新研究院 遼寧 沈陽 110016) 3(中國科學院大學 北京 100049)
真實場景的輻射通常遍及一個很廣泛的譜段范圍。高光譜圖像(HSI)包含特定場景各種譜段強度的積分,相比于其他圖像,HSI圖像能夠為真實的場景提供更多有用的信息,因而有利于計算機視覺中的很多任務,比如分類[1-3]、分割[4-5]、檢測[6-7]、檢索[8]。
然而,在實際情況下,HSI總會受到傳感器精度、光照條件或者大氣環境所引起的噪聲。噪聲的存在會嚴重影響高光譜圖像后續任務的性能。因此,HSI的降噪是一個備受關注的問題。
局部平滑先驗是HSI去噪任務中使用最廣泛的先驗之一。空間局部平滑先驗是指相似的目標或者場景通常與相似的譜波相鄰分布;而光譜平滑性是指HSI的相鄰光譜通常是用相似的傳感器參數收集而導致具有相似的值。因此,HSI所持有的局部平滑先驗等同于沿著HSI的空間和譜段維度的梯度圖的稀疏性,這也就是我們平時所聲稱的3D全變分正則或者3DTV。3DTV正則已經在各種HSI處理問題中大放異彩[9-11],一些甚至獲得了最先進的性能。
即使被成功地應用HSI的各種任務,3DTV正則仍然沒有充分考慮到HSI的梯度圖背后的深刻的稀疏性結構知識。具體來說,遍及梯度圖所有頻譜的稀疏性被隱式地假設為相似的和不相關的。然而,這一點被Peng等[12]指出背離了事實。一方面,梯度圖的不同譜段并不是同分布的;另一方面,HSI梯度圖的不同譜段有明顯的相關性,這一點源于原始HSI的波段相關性。這種與實際HSI的先驗知識偏差使得這種有用的正則化項的能力仍有很大的空間需要進一步加強。因此,Peng等提出了增強版的3DTV正則E-3DTV以解決常規3DTV的不足。
進一步,一個基于E-3DTV的去噪模型被Peng等提出,他們采用1范數來擬合實際噪聲。盡管憑借E-3DTV的優勢取得了令人印象深刻的效果,然而,這個模型對于噪聲的處理過于粗糙,1范數的噪聲建模通常只能有效地處理拉普拉斯噪聲。而HSI中包含的實際噪聲是未知而復雜的,只針對特定類型的噪聲分布建模只能獲得次優的結果。
為了彌補單一范數的噪聲擬合,已經有一些工作在這方面做了嘗試。其中Wen等[13]提出用p范數來替代流行的1范數去擬合噪聲。相比于只適合處理拉普拉斯噪聲的1范數,p范數有一個更加寬廣的適應范圍,它把普遍應用的1范數和2范數視為其中的一種特例,并能在其中取得較好的均衡,尤其在具有非常嚴重的拖尾分布的高度脈沖噪聲情形。令p<1可能是一種更加明智的選擇。
因此,本文針對HSI中多變而復雜的實際噪聲提出一種基于p范數的E-3DTV去噪模型,以提高模型在實際噪聲場合中的適應能力。



(1)

代表在位置(i,j,k)處沿著空間高度、空間寬度和光譜維度三種不同的操作。三種在HSI上不同模式的差分運算可被計算如下:

(2)


(3)

這個線性操作編碼了HSIX∈Rhw×s和它的梯度圖Gn∈Rhw×s之間的關系。
在梯度上最普遍使用的稀疏度量,也就是1范數標記為:
通過這個稀疏度量,在HSI中廣泛使用的局部平滑正則項,也就是所謂的3DTV[14-15]正則構造如下:
為了避免3DTV中稀疏性獨立同分布的假設,Peng等提出了E-3DTV。與常規3DTV相似,E-3DTV也是在長度、寬度、波段三個維度上操作。不同的是,E-3DTV的稀疏約束不施加在梯度圖本身,而是施加在梯度圖的子空間基上。每一組基由梯度圖向量的線性組合來獲得:GnVn。其中Vn是尺寸為s×r的轉換矩陣,其中r<
如前所述,對于一個給定的HSI,其梯度圖Gn的稀疏性并非是獨立而是有相關性的,這意味Gn也可以表達為如下的矩陣分解形式:

Un=GnVn
(8)

E-3DTV正則每一個Gn(n=1,2,3)如下:
式中:Vn可以看作將不同梯度圖關聯在一起的一個系數矩陣。
可以看出,E-3DTV實際上度量的是Gn經過線性轉換后的稀疏性,而轉換矩陣Vn由輸入數據自動決策。相比于常規的3DTV,E-3DTV在度量梯度圖稀疏性同時考慮了梯度之間的相關性,充分利用了在Gn存在一些稀疏的低秩基,但是能用一個系數矩陣Vn表達Gn所有信息的事實,并且當HSI被破壞時,這些基的計算比梯度圖本身更穩定。
由于式(9)不容易被直接解出。我們重寫式(9)為如下等價形式:
Un∈Rhw×rVn∈Rs×r
通過沿著梯度圖的空間高度,寬度和光譜維度應用式(11)的稀疏度量,E-3DTV正則項有如下表達式:
它有如下等價形式:
Un∈Rhw×r,Vn∈Rs×r,n=1,2,3
去噪任務是將干凈的數據和噪聲從帶噪聲的數據中分開。在許多降噪任務中,通常假定噪聲為高斯噪聲,因此經常利用干凈數據與噪聲數據之間的2范數作為損失函數。但是,基于最小二乘的2范數對觀測值中的異常值高度敏感,當測量結果包含較大的誤差或脈沖噪聲時,1范數損失函數與2范數損失函數相比,可以顯著改善性能[16-17],因此,Peng等提出基于1范數的E-3DTV去噪模型如下:
s.t.Y=X+E
式中:Y是觀測圖像;E是觀測圖像中包含的噪聲;τ是權衡因子。
然而,在實際的高光譜場景中,噪聲的類型遠不止高斯分布和拉普拉斯分布,例如稀疏噪聲、條紋噪聲、死線、像素缺失等[18-19]。我們因此提出基于p范數的E-3DTV去噪模型,其數學表達式如下:
s.t.Y=X+E,0≤p≤2
p范數是1范數與2范數一種推廣,它可以通過調節p值的大小而改變對異常值的敏感性,以適應復雜多變的實際噪聲。例如,在沒有異常值或異常值較小的情況下,可能要求p≥1,而對于具有非常嚴重的拖尾分布的高度脈沖噪聲,可能要求p≤1。而固定類型的1范數與2范數都不具備這種泛化性。
為了對p范數有效地求解,Wen等通過將p范數函數的近端算子合并到增強拉格朗日方法的框架中,有效地解決p范數中的凸和非凸情況,并針對凸和非凸情況作了收斂性分析,本文可以直接利用其結論。考慮罰數為η的函數g(x):x∈Rm的近端操作的一般形式如下:

情形1:當p=0,近端操作成為眾所周知的硬閾值操作:
式中:ti是向量t的第i個元素,i=1,2,…,m。
情形2:當0

情形3:當p=1。近端操作有閉式解:
proxg,η(t)i=Sa/η(t)i=
sign(ti)max{|ti|-a/η,0}
(18)
對于i=1,2,…,m,Sa:Rm→Rm是眾所周知的軟閾值或者收縮算子。
情形4:當1
proxg,η(t)i=sign(ti)zi
(19)
式中:zi是式(20)的解。
h2(z)=apzp-1+ηz-η|ti|=0z≥0
(20)
注意對于z≥0,h2(z)是一個遞增的非凸函數,并且當ti≠0時,h2(z)<0,h2(|ti|)>0。因此,當ti≠0,式(20)滿足0 Wen等論證了求解噪聲E的子問題即可看成近端操作形式中的一種。接下來,我們將使用ADMM算法以及上述公式對式(14)求解。 基于式(14),我們可以有如下等價表達式: s.t.Y=X+E, Vn∈Rs×r,Un∈Rhw×r,n=1,2,3 求解這個模型等價于最小化其增廣的拉格朗日函數如: 式中:Mn(n=1,2,3)和Γ是拉格朗日乘子;μ是一個大于0的標量。 在ADMM框架下,我們需要交替固定其他向量并優化涉及式(23)中的每一個變量。 更新X。提取式(23)所有關于X的項,我們能獲得如下子問題: 優化式(24)等價于求解如下線性系統: (26) 更新Un,n=1,2,3。提取式(23)關于Un的所有項,我們可以得到: 這個子問題能夠使用眾所周知的軟閾值算子求解[23]。 式中:x∈R且Δ>0是閾值。然后式(28)有如下閉式解: 更新Vn,n=1,2,3。提取式(23)關于Vn的全部項,有如下子問題: 這個子問題的全局解有閉式解[21]: 式中:B、D、C是執行svd分解后的結果。 更新E。提取式(23)所有關于E的項,關于E的子問題近端操作形式中的一種[13],它可以通過如下方式有效的解決: (32) 基于ADMM準則,乘子的更新方式如下: 完整的ADMM求解過程如算法1所示。算法功能流程如圖1所示。 圖1 算法功能流程 算法1基于p范數的E-3DTV去噪模型 輸出:fold(X)∈Rh×w×s。 初始化:初始化X,E,Un,Vn,Mn,Γ。 循環: 1.通過式(26)和式(32)更新X,E 2.通過式(27)和式(31)更新Un,Vn 3.通過式(33)更新Mn,Γ 4.i=i+1 5.核對收斂準則 或者i=50 結束循環 這個部分,我們做了廣泛的實驗論證本文方法的性能,我們把本文方法與4種經典的HSI去噪方法相比較。它們分別是CWM[24]、LRMR[25]、LRTV[26]、E-3DTV[12]。為了全面地評價實驗結果,我們采用三種量化指標,它們分別是PSNR、SSIM[27]、ERGAS[28]。PSNR和SSIM是兩種經典的基于空間的圖像恢復評價指標,而ERGAS是基于光譜的評價指標。PSNR和SSIM越大越好,而ERGAS越小越好。 案例1:每一幅圖像都加入零均值、0.1方差的高斯噪聲。 案例2:首先加入類似于案例1中的高斯噪聲到每一幅圖像上,然后從第91幅至第130幅加入條紋噪聲。 案例3:每一幅HSI加入零高斯噪聲和脈沖噪聲。高斯噪聲方差設為0.075,脈沖噪聲的百分比設為0.5。 案例4:加入像案例3一樣的高斯脈沖混合噪聲,加入像案例2一樣的條紋噪聲。 視覺質量方面,我們在圖2展示了通過不同方法在四種不同噪聲案例下的恢復結果,其中案例1展示的圖像是第56幅,案例2展示的圖像是第112幅,案例3展示的圖像是168幅,案例4展示的圖像是第224幅。可以明顯地看到E-3DTV相較于其他方法不僅能使恢復的圖像殘留更少的噪聲,而且還能保持更加銳利的細節。而我們采用基于p范數的E-3DTV模型能在此基礎上獲得性能上的進一步提升。這得益于p范數處理不同噪聲的靈活性。 圖2 不同方法在不同噪聲情形下的比較 在量化比較方面,我們把各種方法恢復結果的三種指標展示在表1至表4。E-3DTV模型在其他三種競爭方法面前仍然保持較大優勢。這側面印證了E-3DTV的優越性,然而,我們的方法在各個指標全面超越了E-3DTV,印證了本文方法的意義和有效性。 表1 不同方法在案例1噪聲情形下的比較 表2 不同方法在案例2噪聲情形下的比較 表3 不同方法在案例3噪聲情形下的比較 表4 不同方法在案例4聲情形下的比較 由于本文重點考慮的是p范數相較于單純的1范數和2范數對E-3DTV去噪模型帶來的靈活性。我們重點觀察了p參數的設置對實驗結果帶來的影響。以案例1和案例3為例,在保持其他參數設置不變的情況下,我們列舉當p<1、p=1、2>p>1、p=2時對結果的影響在表5和表6,我們加粗了最好的結果。可以看到對于不同的噪聲采用不同p值對結果有較大影響,因而單純地用1范數或者2范數建模噪聲是不足夠的,此外,最好的效果均不在p剛好為1或剛好為2時取得,進一步說明了p范數建模的意義。 表5 本文的方法在案例1噪聲情形下不同p值的比較 表6 本文方法在案例3噪聲情形下不同p值的比較 本文提出新的基于p范數的E-3DTV模型用于高光譜圖像去噪,得益于p范數在處理不同噪聲時的靈活性,本文方法具有比原E-3DTV模型更強大的噪聲去除能力和細節恢復能力。下一步的研究會考慮把p范數用于約束梯度圖的基矩陣Un,以期望獲得適應性更強的HSI去噪模型。 此外,由于HSI采集通常有數百個頻譜,這使得HSI需要較大的存儲空間。在將它們發送到地面基站時,這將引起低效率和高成本的嚴重問題。因此,有必要針對HSI壓縮感知設計有效的技術,以滿足實時傳輸的需要。由于p范數和E-3DTV正則的結合展現出了良好的重構性能,把這個方法拓展在壓縮感知模型上也將作為我們未來研究的方向。
4 ADMM算法求解







5 HSI圖像去噪實驗
5.1 實驗設置

5.2 實驗結果展示







6 結 語