董安國, 龔文娟, 韓 雪
(長安大學理學院,西安 710064)
基于線性表示的高光譜影像波段選擇算法
董安國, 龔文娟, 韓 雪
(長安大學理學院,西安 710064)
為了去除高光譜影像的數據冗余,提高高光譜影像處理的精度和效率,提出了一種基于線性表示的高光譜影像波段選擇算法。針對每一個波段,建立與其他波段的線性表示關系,依據復相關系數確定相關程度最高的波段,將其作為冗余波段去除; 對剩余波段重復上述過程,得到最小波段集; 并證明了利用該波段集和全波段所選的端元是一致的,在不影響端元提取的前提下,最大程度地去除了冗余波段。通過2組實驗結果證明了該波段選擇算法的可行性和有效性。
高光譜影像; 線性表示; 波段選擇; 復相關系數算法
隨著高光譜遙感技術的發展,高光譜傳感器可以同時捕捉從可見光到紅外范圍的數百個波段,高光譜圖像豐富的波段信息為地物分類和目標識別提供了數據支持,同時,其海量數據和信息冗余也給計算帶來了困難。為了提高計算效率和精度,需要在不損失信息的情況下盡可能降低數據的維數。其主要方法有特征提取[1]和波段選擇2種。特征提取是利用線性或非線性變換來降低數據的維數,將原始的高維數據變換到一個新的低維空間,如主成分分析法[2]和Fisher線性判別分析[3]等,但是由于數據變換,使得降維后的數據在物理屬性上發生了變化; 而波段選擇作為一種高光譜數據的預處理技術,從高光譜圖像的上百個波段中,去除部分信息冗余波段,選擇出能充分代表原始圖像信息的波段子集,在保持數據信息不受損失的前提下去除部分波段,降維后的數據仍保持了原始數據的物理屬性。
常見的波段選擇算法有: ①基于信息量的算法,如基于加強的快速密度峰值的聚類算法[4]、基于三元互信息的波段選擇算法[5]、基于互信息的子空間檢測算法[6]、典型性成分分析[7]和粗糙集理論算法[8]等,這類算法通常先根據各個波段的信息進行排序,選出排序靠前的一些波段,雖然簡單易行,但容易選出連續波段; ②基于搜索的算法,如灰狼優化算法[9]、快速體積梯度算法[10]、改進的螢火蟲算法[11]、列子集選擇算法[12]、克隆選擇算法[13]和基于正交投影散度的算法[14]等,這類算法雖然可以解決波段選擇過程中波段組合數目多、遍歷難的問題,但算法相對復雜,通常需要的搜索時間較長,而且會存在收斂速度問題。
目前大部分的波段選擇算法都是基于聚類的思想,根據兩兩波段的相似關系進行聚類,進而去除每個類中的部分波段,但并未對多個波段間的線性表示關系進行有效地刻畫和利用。鑒于這一思想,提出一種新的基于線性表示的波段選擇算法。該算法針對每一個波段,建立與其他波段的線性表示關系,依據復相關系數的大小剔除冗余波段,得到最小波段集。
假設高光譜圖像中的像元數為N,端元數目為s,波段數為L,正整數集合Ψ1={1,2,…,N},Ψ2={1,2,…,s},Ψ3={1,2,…,L}。第i個像元的高光譜向量為ai(i∈Ψ1),記向量組α=(α1,α2,…,αN)。在理想情形下,根據線性表示理論,α中一定存在若干個線性無關的向量αk1,αk2,…,αks,使得α中的每一個向量均可由αk1,αk2,…,αks線性表示。
設向量αi=(α1i,α2i,…,αLi)T,其中i∈Ψ1,則
(1)
αk=λ1αk1+λ2αk2+…+λsαks,
(2)
則線性方程組
x1αk1+x2αk2+…+xsαks=αk,
(3)
有唯一解,該方程組增廣矩陣的第t行可由其他行線性表示,所以從方程組中去掉第t個方程后與原方程是同解方程, 故可得式(2)(αk1,αk2,…,αks線性無關)的充分必要條件是
(4)


由上述推論可知,當一像元向量可以由若干個線性不相關的其他像元向量線性表示時,刪除可被其他波段向量線性表示的波段后,每個像元與其他像元之間的線性表示關系不變,故波段選擇可以轉化為求矩陣行的極大線性無關組。
復相關系數是反映一個因變量與一組自變量之間相關程度的指標,其值越大,變量之間的線性相關程度越密切,可以用來判斷某向量是否能被其他向量近似線性表示。設線性回歸模型為
y=x1β1+x2β2+…+xpβp+ε,
(5)
式中: 響應變量y的觀測值為(y1,y2,…,yn)T;xi的觀測值為(xi1,xi2,…,xin)T(i=1,2,…,p);ε為隨機誤差向量。利用最小二乘法可得
β=(β1,β2,…,βp)T=(xTx)-1xTy。
(6)
y與x之間的復相關系數R(0≤R≤1)的計算公式為

(7)
(8)
(9)
由1.1節理論基礎可知,采用復相關系數進行高光譜波段選擇,在去掉若干波段后,剩余的波段仍能代表原始高光譜波段的信息。

算法的具體步驟如下:
1)輸入高光譜圖像數據A(其中每個行向量代表一個對應波段)、集合S=Ψ3和閾值α。
2)對所有i∈S,計算Xi與{Xk}k∈S-{i}的Ri。

設Xi與{Xk}k∈Ψ3-{i}的線性表達系數為β(i),則
(10)
式中X(i)表示從X=(X1,X2,…,XL)中刪除第i列得到的矩陣。對不同的i,j∈Ψ3,矩陣X(i)和X(j)只有一列不同,導致求Ri(i∈Ψ3)時,存在大量重復計算,為了簡化計算,進行算法優化。

(11)
XTXi=(b1,i,b2,i,…,bi,i,…,bL,i)T,
(12)

(13)
依據以上結論,原算法第1步后先進行優化,即:
1)X=AT,B=XTX。
2) 對i∈S,劃去B的第i行第i列得到的子矩陣C(i),并記
D(i)=(b1,i,b2,i,…,bi-1,i,bi+1,i,…,bL,i)T,
(14)
計算
β(i)=(C(i))-1D(i),
(15)
由公式(7)計算Xi與{Xk}k∈S-{i}的Ri,轉原算法第3步。
通過優化可知,計算工作量主要集中在第1步,整個迭代過程沒有出現重復計算。
為了驗證本文算法的有效性,分別采用一組具體數字和美國內華達州Cuprite地區的AVIRIS數據進行實驗,并在全波段和利用本文算法選出的波段下分別提取端元,分析提取效果。
給定5個互不相關的100維向量作為端元,分別用α1,α2,α3,α4,α5來表示,隨機產生10 000組歸一化的非負系數(每組5個),每組系數作為α1,α2,α3,α4,α5的組合系數合成10 000個向量。將包括α1,α2,α3,α4,α5在內的10 005個向量視作具有100個波段的高光譜向量(屬理想情形),用本文算法進行波段選擇,取α=0.995閾值時,所選擇的波段數目為5。采用文獻[15]中的端元提取方法對本文算法所選的5個波段進行端元提取實驗,得到的端元恰好是α1,α2,α3,α4,α5。
在上述10 000個向量中,附加高斯噪聲(屬非理想情形),采用本文算法進行波段選擇,閾值α=0.95,所選擇的波段數目仍為5。采用文獻[15]中方法提取得到的端元也仍為α1,α2,α3,α4,α5。
為了使實驗更具有普適性,再分別給定8和12個互不相關的100維向量作為端元,并分別用m1,m2,…,m8和n1,n2,…,n12來表示,重復進行上述實驗,實驗結果如表1所示。

表1 端元提取結果Tab.1 Results of endmember extraction
由表1可以看出,在理想和非理想情況下,用文獻[15]中的端元提取方法在全波段下和采用本文算法所選波段下提取出的端元是一致的,從而驗證了本文算法的準確性和有效性。
Cuprite地區AVIRIS原始數據共有224個光譜波段,光譜分辨率為10 nm。本文刪除了噪聲較大和光譜吸收較大的波段,選擇172—221光譜區間的50個波段用于算法測試。在實驗中,取閾值α=0.995,所選擇的波段數目為20,并采用文獻[15]中端元提取方法,分別基于全波段及本文算法所選波段提取端元,最終確定對應的礦物類型。

(a) 全波段 (b) 本文算法所選波段
圖1端元位置
Fig.1Locationoftheendelement
由圖1對比可以看出,2種波段范圍選擇的端元位置是一致的,即在本文算法所選波段與全波段下提取出的端元是相同的。圖中的9個端元位置坐標分別為: (2,374),(58,202),(174,588),(233,437),(262,459),(276,180),(392,152),(433,75)和(495,159)。將所選擇端元進行豐度分解,便可確定出各端元所對應的礦物類型。由本文算法選出的少量波段與全波段提取的端元相同,不僅減少了計算量,還達到了較好的應用效果,證明了該算法的可行性與有效性,為后續工作的開展提供了幫助。
基于線性表示提出了一種新的高光譜影像波段選擇算法,該算法利用復相關系數進行波段選擇,并對算法進行了優化,克服了以往算法僅僅計算兩兩波段間相關性的不足,而從整體上考慮波段間的相關性,簡化了計算量的同時,起到了降噪的目的。實驗結果表明了該算法在波段選擇中的可行性與有效性,并且具有普適性。該算法為后續高光譜影像的地物識別提供了一種技術支持。
[1] Jia X P,Kuo B C,Crawford M M.Feature mining for hyperspectral image classification[J].Proceedings of the IEEE,2013,101(3):676-697.
[2] Agarwal A,El-Ghazawi T,El-Askary H,et al.Efficient hierarchical-PCA dimension reduction for hyperspectral imagery[C]//Proceedings of 2007 IEEE international symposium on signal processing and information technology.Giza:IEEE,2007:353-356.
[3] Lei W,Prasad S,Fowler J E,et al.Locality-preserving dimensionality reduction and classification for hyperspectral image analysis[J].IEEE Transactions on Geoscience and Remote Sensing,2012,50(4):1185-1198.
[4] Jia S,Tang G H,Zhu J S,et al.A novel ranking-based clustering approach for hyperspectral band selection[J].IEEE Transactions on Geoscience and Remote Sensing,2016,54(1):88-102.
[5] Feng J,Jiao L C,Zhang X R,et al.Hyperspectral band selection based on trivariate mutual information and clonal selection[J].IEEE Transactions on Geoscience and Remote Sensing,2014,52(7):4092-4105.
[6] Hossain M A,Jia X P,Pickering M.Subspace detection using a mutual information measure for hyperspectral image classification[J].IEEE Geoscience Remote Sensing Letters,2014,11(2):424-428.
[7] Sun K,Geng X R,Ji L Y.Exemplar component analysis:A fast band selection method for hyperspectral imagery[J].IEEE Geoscience Remote Sensing Letters,2015,12(5):998-1002.
[8] Patra S,Modi P,Bruzzone L.Hyperspectral band selection based on rough set[J].IEEE Transactions on Geoscience and Remote Sensing,2015,53(10):5495-5503.
[9] Medjahed S A,Saadi T A,Benyettou A,et al.Gray Wolf Optimizer for hyperspectral band selection[J].Applied Soft Computing,2016,40:178-186.
[10] Geng X R,Sun K,Ji L Y,et al.A fast volume-gradient-based band selection method for hyperspectral image[J].IEEE Transactions on Geoscience and Remote Sensing,2014,52(11):7111-7119.
[11] Su H J,Yong B,Du Q.Hyperspectral band selection using improved firefly algorithm[J].IEEE Geoscience Remote Sensing Letters,2016,13(1):68-72.
[12] Wang C,Gong M G,Zhang M Y,et al.Unsupervised hyperspectral image band selection via column subset selection[J].IEEE Geoscience Remote Sensing Letters,2015,12(7):1411-1415.
[13] Feng J,Jiao L C,Liu F,et al.Mutual-information-based semi-supervised hyperspectral band selection with high discrimination,high information,and low redundancy[J].IEEE Transactions on Geoscience and Remote Sensing,2015,53(5):2956-2969.
[14] 蘇紅軍,盛業華,He Y,等.基于正交投影散度的高光譜遙感波段選擇算法[J].光譜學與光譜分析,2011,31(5):1309-1313.
Su H J,Sheng Y H,He Y,et al.Orthogonal projection divergence-based hyperspectral band selection[J].Spectroscopy and Spectral Analysis,2011,31(5):1309-1313.
[15] Gao L R,Gao J W,Li J,et al.Multiple algorithm integration based on ant colony optimization for endmember extraction from hyperspectral imagery[J].IEEE Journal of Selected Topics in Applied Earth Observations in Remote Sensing,2015,8(6):2569-2582.
Bandselectionmethodforhyperspectralimagebasedonlinearrepresentation
DONG Anguo, GONG Wenjuan, HAN Xue
(SchoolofScience,Chang’anUniversity,Xi’an710064,China)
In order to remove the data redundancy of hyperspectral image and improve the accuracy and efficiency of hyperspectral image processing, this paper proposes a band selection method based on linear representation of hyperspectral image. A linear relationship is established for a band with the other bands, and the most relevant band is removed as a redundant band which is determined based on the multiple correlation coefficient. The set of minimum bands is finally obtained by repeating the above process for the remaining bands. It is proved that the set of selected endmembers by using the above bands is consistent with the set selected by using all bands, and the redundancy bands are removed to the greatest extent without affecting the endmember extraction. The experimental results show that the band selection algorithm in the paper is feasible and effective.
hyperspectral images; linear representation; band selection; multiple correlation coefficient algorithm
10.6046/gtzyyg.2017.04.07
董安國,龔文娟,韓雪.基于線性表示的高光譜影像波段選擇算法[J].國土資源遙感,2017,29(4):39-42.(Dong A G,Gong W J,Han X.Band selection method for hyperspectral image based on linear representation[J].Remote Sensing for Land and Resources,2017,29(4):39-42.)
TP 79
A
1001-070X(2017)04-0039-04
2016-05-25;
2016-08-08
國家自然科學基金項目“高分辨率遙感影像信息提取的特征結構化多尺度分析方法研究”(編號: 41571346)、“基于高維馬爾可夫網結構統計方法的高光譜圖像分割研究”(編號: 40971217)和“無限時滯脈沖泛函微分方程及其在經濟中的應用”(編號: 11201038)共同資助。
董安國(1964-),男,教授,碩士生導師,主要從事數值代數及數字圖像處理研究。Email: donganguo@chd.edu.cn。
龔文娟(1987-),女,碩士研究生,主要從事數字圖像處理方向研究。Email: gngwenjuan0919@163.com。
(責任編輯:陳理)