王立國,趙 亮,劉丹鳳
(哈爾濱工程大學信息與通信工程學院,150001哈爾濱)
基于人工蜂群算法高光譜圖像波段選擇
王立國,趙 亮,劉丹鳳
(哈爾濱工程大學信息與通信工程學院,150001哈爾濱)
為減少高光譜遙感圖像光譜空間冗余、降低計算復雜度,提出一種基于人工蜂群算法的高光譜圖像波段選擇方法.首先,根據波段相關性矩陣對全波段進行預處理,獲得相關性較小的波段子空間;然后,利用人工蜂群算法以最佳指數與JM距離的加權和為適應度函數在各子空間進行鄰域搜索,不斷更新至收斂為止,從而獲得最優波段組合.最后,利用AVIRIS數據和ROSIS數據對提出的算法與基于蟻群,粒子群,擬態物理學算法的波段選擇方法進行實驗.仿真結果表明:基于人工蜂群算法的波段選擇能夠在保證良好收斂性的同時,大大降低計算花費,所獲得的波段組合用于高光譜圖像分類時,可以得到較好的分類精度.
高光譜遙感;波段選擇;人工蜂群算法;分類
高光譜遙感數據具有高維的特點,并且光譜空間各波段相關性大,冗余度高,在后續進行分類處理時會出現Hughes現象,而降維即可壓縮數據,降低其存儲空間也可減少計算復雜度,因此降維對高光譜遙感數據的后續處理具有重要意義.
波段選擇作為一種直接的降維方法,主要依據光譜數據的特點選擇合適的波段變量,在保留原始波段變量的物理意義以及光譜特性同時降低了數據維度,可以效地對高光譜圖像降維[1].根據是否有先驗知識,高光譜圖像波段選擇方法可分為有監督波段選擇和無監督波段選擇[2].由于有監督波段選擇方法可對已知類別樣本數據進行學習訓練,因此通常能夠取得更好的結果.
對于波段搜索方法,一般分為兩種:最優搜索算法和次優搜索算法[3].最優搜索算法實質是窮舉法,對于具有高維特征的高光譜遙感數據窮舉所有波段組合難以實現,因此實際中更多的是選擇次優搜索算法.次優搜索算法是以準則函數為評價依據,通過特定的方法從波段組合中選擇一組性能比較好,但不一定最好的特征組合.最簡單的次優搜索策略采用序貫前向選擇法和序貫后向選擇方法,預先設置特征子集的數目,然后每次從當前的特征子集中加入或去除一個特征來獲取最佳的特征子集[4].
近年來,隨著智能優化算法的發展,許多搜索算法也被用于降維,具有代表性的如遺傳算法[5]、蟻群算法[6]、擬態物理學算法[7]等.從實驗結果來看這類方法的效果要好于其他方法,為高光譜遙感圖像波段選擇研究提供新方向.雖然上述方法可以選擇出較好的波段子集,但是收斂速度較慢,因此針對以上方法搜索時間較長的缺點提出一種基于人工蜂群的波段選擇方法.人工蜂群算法[8]是一種新的群智能算法,以自然界中蜂群的自組織模型和群體智能為基礎的一種仿生算法,它的主要特點是不需要預先知道問題的特殊信息,只需要對問題做質量評價,通過人工蜂的個體尋優,最后在群體中得到全局最優.經過大量標準函數測試實驗表明,人工蜂群算法通過3種蜂群間的協作與角色轉換,較好的緩解了搜索范圍的擴展與在原搜索域進行精密搜索間的矛盾,在很大程度上避免了陷入局部最優的問題,另外其在搜索最優解的過程中采用了貪婪的搜索策略,相比其他非貪婪搜索算法,其收斂速度更快.因此本文提出了基于人工蜂群算法的波段選擇算法,并通過實驗驗證其有效性.
波段選擇主要包括兩個部分:波段選擇的準則和搜索波段的算法.由于高光譜遙感圖像具有相鄰波段的光譜相關性強的特點,因此預先對波段進行子空間劃分,得到相關性較弱的幾個子空間,再在各個子空間內搜索需要數目的代表波段.而后利用搜索算法根據所選準擇函數選擇波段組合.
1.1 子空間劃分
自動子空間劃分的方法主要是根據波段相關系數矩陣圖像分塊特性及近鄰可傳遞相關性來進行高光譜數據空間劃分,步驟如下[9]:
1)將二維波段圖像轉換為一維的波段向量;
2)計算波段向量的相關系數得到高光譜數據的相關矩陣R,其定義為R=[r1,1,r1,2,…,rj,1;r2,1,r2,2,…,rj,2;…;rj,1,rj,2,…,rj,j];
3)從相關矩陣中來提取近鄰可傳遞相關矢量rNTR,其定義為rNTR=[r1,2,r2,3,…ri,i+1,…rj-2,j-1,rj-1,1]T,對近鄰可傳遞相關矢量進行處理得到c-1個局部相關的極小值;
4)根據得到的c-1個極小值將高光譜數據空間劃分c個適合的數據子空間.
經過劃分后可以得到不同維度的子空間,每個子空間內的波段數據具有相近的光譜特性.
1.2 選擇準則
選擇方法一般依據各波段的信息量以及波段間的相關程度來選擇有代表性的波段,通常選擇信息量大、相關性較小的波段.因此兼顧信息量與相關系數的最佳指數OIF(optimum index factor)適合作為波段選擇的選擇準則:

式中:Si是第i波段的標準差,n為波段數目,Rij為第i波段和第j波段的相關系數.同時,為使后續的分類效果更好,則加入衡量類別可分性的判據與OIF共同作為選擇準則.鑒于JM(jeffries-matusita)距離兼顧數據的一階和二階統計量,且在高維數據空間二階統計量對分類精度的提高非常重要,因此類別可分性判據選擇JM距離[10]為

式中:μi、μj分別為第i、j類地物光譜均值矢量,Ci、Cj分別為第i、j類地物在任意波段組合上的協方差矩陣.
1.3 搜索算法
對于搜索算法,本文采用人工蜂群算法.人工蜂群算法與蟻群算法類似同屬于群智能算法,是對蜜蜂采蜜行為進行分析從而模擬得到的算法.其關鍵要素有:蜜源,雇傭蜂(又稱引領蜂)與非雇傭蜂.其中非雇傭蜂又分為:跟隨蜂和偵察蜂.由這3種要素又產生3種行為模式,蜜源吸引蜜蜂,搜索蜜源,舍棄蜜源.算法的主要思想是:在隨機產生的初始蜂群(其中蜜源與雇傭蜂是一一對應的)中,在收益度高的一半蜜源附近開始搜索,采用一對一的競爭生存策略擇優保留個體,此過程為雇傭蜂搜索.然后利用輪盤賭選擇方式選擇較優個體,并在其周圍進行貪婪搜索,產生另一半個體,這一過程稱之為跟隨蜂搜索.將引領蜂和跟隨蜂產生個體組成新的種群,避免種群多樣性喪失進行偵察蜂的類變異搜索,形成迭代種群.算法通過不斷地迭代計算,保留優良個體,淘汰劣質個體,向全局最優解靠近[8].基于引言中介紹的人工蜂群算法的以上幾個優點,本文將其用于搜索最佳波段組合.
2.1 蜜源初始化
2.1.1 蜜源的維數
本文提出的基于人工蜂群算法的波段選擇中每只引領蜂所對應的蜜源代表著一種可能的波段組合.而蜜源的維數l,即等于波段組合中的波段數.對波段進行子空間劃分后,得到n個相關性較低的子空間,因此解的形式有兩種:1)每個子空間內各選l個波段,最后的波段組合內含有n個波段;2)按照各子空間內所包含波段數的比例來決定每個子空間所選的波段數
2.1.2 蜜源的位置與收益度
初始蜜源的位置按照式(4)隨機生成,同時將進化代數置為0,NNP為蜜源個數分別為各波段子空間的上下邊界.為第0代種群中的第i個蜜源,Rrand為[0,1]區間上的隨機數.

至此,蜜源可為一個NNP×l的矩陣,矩陣的每一行代表著一種波段組合策略.蜜源的收益度(適應度函數)則綜合波段組合的信息量,相關度以及類別可分性,采用OIF及JM距離的加權和來衡量. OIF及JM距離均為數值越大越好.
2.2 蜜源的更新
按照2.1.2中方法計算第t代蜜源的收益度,將收益度較高一半蜜源對應雇傭蜂中的引領蜂,收益度較低的一半蜜源對應跟隨蜂,然后引領蜂和跟隨蜂各自進行搜索,更新蜜源位置,而蜜源的個數始終保持不變,為引領蜂和跟隨蜂種群的個體的總和.
2.2.1 引領蜂搜索

式中:Rrand為(0,1)之間隨機數,由于所得個體V的元素為波段序號,所以對鄰域增量進行取整操作,如果每個個體的某一維在更新過程中,其數值超過子空間的范圍則做如下處理.

2.2.2 跟隨蜂搜索
引領蜂完成鄰域搜索后,跟隨蜂會依概率選擇當前跟隨蜂所對應的較優蜜源,完成采蜜.所依據的概率如式(7)所示,用輪盤賭的選擇方式選出較優的引領蜂個體選擇的個體按式(4)進行搜索,產生新的跟隨蜂個體更新跟隨蜂種群.

2.2.3 偵察蜂搜索
雇傭蜂完成搜索g(g<G)次后,若有某一蜜源連續Llimit次不變,則相應雇傭蜂個體角色轉為偵查蜂,按照式(4)產生新蜜源,計算新蜜源收益度,然后與原蜜源收益度比較,擇優保留收益度高的蜜源.
2.3 基于人工蜂群算法的波段選擇流程
基于人工蜂群算法的波段選擇流程總結以下步驟:
步驟1初始化參數蜜源數目NNP、蜜源停留最大次數Llimit和迭代次數G,對波段空間進行子空間劃分,按照式(4)隨機生成NNP個l維蜜源,設置進化代數為t=0;
步驟2按式(2)、(3)計算各個蜜源的收益度,即當前各波段組合的OIF與JM距離的加權和;
步驟3對蜜源收益度按照從大到小進行排列,收益度高的前NNP/2對應引領蜂種群,后NNP/2對應跟隨蜂種群;
步驟4計算新蜜源與原蜜源的收益度,擇優貪婪選擇蜜源,同時按照蜜源選擇更新或保持引領蜂種群中的各個個體;
步驟5跟隨蜂種群按式(7)依概率從步驟4新引領蜂種群所對應蜜源中選擇,并按式(4)更新種群個體,依貪婪準則保留優質蜜源形成跟隨蜂種群;
步驟6結合步驟5和6中個體構成迭代種群;
步驟7判斷是否有蜜源連續Llimit次不變,若有則進行偵查蜂搜索,并按式(4)產生新蜜源.記錄現有人工蜂群所搜索到的最優蜜源,即當前最佳波段組合.
步驟8令迭代次數t=t+1,若t<G則轉步驟3繼續迭代至t=G,停止搜索,輸出最優波段組合.
整個算法的流程見圖1.

圖1 ABC算法的操作流程
為驗證本文算法的有效性與可行性,進行了仿真實驗,同時與基于蟻群算法ACO(ant colony optimization),基于粒子群算法PSO(particle swarm optimization),以及基于擬態物理學算法APO(artificial physics optimization)的波段選擇算法進行對比[6-7,11].實驗環境為AMD雙核處理器,主頻2.47 Hz,有效內存3 GB,開發環境為Matlab R2008a.
實驗數據為AVIRIS印第安納農林數據和ROSIS帕維亞大學數據.印第安納農林數據大小為144×144,包含200個可用波段,剔除背景共包含16類地物,主要農作物是生長期的玉米和大豆,結合地面實際測量數據,其中7種地物樣本量過少,對于該數據不具有代表性,因此選取另9種樣本數目較多的代表性地物作為實驗用地物.帕維亞大學數據大小為610×340,包含103個可用波段,剔除背景共包含9種地物.兩種數據地物類型及數目如表1所示.印第安納農林數據經過子空間劃分后得到子空間為:(1~36)、(37~79)、(80~103)、(104~144)、(145~200),于每個子空間內各選擇一個波段,獲得相關性較低的5波段組合.帕維亞大學數據經過子空間劃分得到子空間為:(1~73)、(74~84)、(84~103),于每個子空間內各選擇一個波段,獲得相關性較低的3波段組合.

表1 地物類別及數目
一般評價所選波段組合的優劣主要從地物可分性,波段相關性以及波段組合所包含的信息量來看,顯然分類效果越好,波段冗余越小并且所呈現的信息量越大的波段組合是我們所需要的.而對于搜索算法來說,搜索效果與搜索時間是同時要兼顧的兩方面,在保證效果的同時能讓搜索時間最少是搜索的目標.因此為驗證本文波段選擇算法的性能,從搜索效果和時間兩個方面來評價各搜索算法.在搜索效果中,用波段間的平均相關性作為相關性衡量標準,其值越小越好;信息量采用OIF衡量,其值越大越好;分類性能采用總體分類精度OA(overall accuracy)衡量,其值越大表示分類正確率越高;而搜索時間為實際算法運行時間.其中平均相關性R與總體分類精度AOA為

式中:mii第i類測試樣本被正確分類的樣本數,c為樣本類別數,C為樣本總數,Rij為波段i和波段j的相關系數

3.1 搜索效果的比較
人工蜂群算法實驗參數設置為:種群規模NNP= 30,迭代次數為30次,蜜源停留最大限制次數Llimit=5.其他算法的參數設置參考文獻[7,12].分類方法為最大似然法,兩種數據分別取3、5、9類地物進行比較,其訓練樣本和測試樣本均為各取50%.并且在實驗中所得到的平均相關性、OIF,分類精度均為20次實驗結果的均值.將4種算法的結果對比列于表2、3.

表2 4種算法搜索效果對比(印第安納數據)

表3 4種算法搜索效果對比(帕維亞大學數據)
從表中數據可看出本文算法與基于蟻群算法的波段選擇方法相較,無論在信息量還是分類精度上均占優,這是由于蟻群算法信息素更新能力有限,算法容易陷入局部最優,從而出現停滯現象;當問題規模增大時,算法效率明顯下降;與基于粒子群算法波段選擇算法相比,基于人工蜂群算法的波段選擇雖然在信息量方面較其略低,但分類精度要高于該算法,因為本文在判決準則中加入衡量類別可分性的JM距離,使搜索到的波段更利于分類處理;而對于基于擬態物理學算法的波段選擇算法相較,在信息量與分類精度上二者相當.
為更直觀地體現分類效果,將實驗所用的9種地物真實分布圖及各種算法分類最好結果示于圖2~7.

圖2 印第安納數據3種類別分類結果

圖3 印第安納數據5種類別分類結果

圖4 印第安納數據9種類別分類結果

圖5 帕維亞大學數據3種類別分類結果

圖6 帕維亞大學數據5種類別分類結果

圖7 帕維亞大學數據9種類別分類結果
3.2 搜索效率的比較
搜索效率的評價為各算法收斂時所用的時間,將其列于表4.從表中數據可看出基于人工蜂群算法的波段選擇所用時間遠低于其他算法.體現出人工蜂群算法收斂速度快的優點.
綜上兩方面可以看出,本文算法在搜索結果上與APO算法相當,但優于ACO算法及ACO算法,而在搜索效率上,本文算法有明顯優勢,因此本文算法更適用于高光譜遙感圖像波段選擇.

表4 4種算法所用時間
本文針對高光譜圖像波段冗余問題,提出了基于ABC算法的波段選擇算法,該算法具有設置參數少、收斂速度快的特點.與基于APO算法、基于PSO算法、基于ACO算法的波段選擇方法進行了對比實驗,仿真結果表明基于ABC算法的波段選擇方法較其他3種智能優化算法在保證分類精度的情況下收斂速度更快,更加能夠滿足實際需求.
[1]GUYOU I,ELISSEEFF A.An introduction to variable and feature selection[J].Journal of Machine Learning Research,2003,3:1157-1182.
[2]劉雪松,葛亮,王斌,等.基于最大信息量的高光譜遙感圖像無監督波段選擇方法[J].紅外與毫米波學報,2012,31(2):166-171.
[3]周爽,張鈞萍,蘇寶庫.基于最速上升算法的超光譜圖像波段選擇搜索算法[J].計算機應用研究,2008,25(11):3501-3503.
[4]SERPICO SB,BRUZZONE L.A new search algorithm for feature selection in hyperspectral remote sensing images[J].IEEE Trans Geoscience and Remote Sensing,2001,39(7):1360-1367.
[5]趙冬,趙光恒.基于改進遺傳算法的高光譜圖像波段選擇[J].中國科學院研究生院學報,2009,26(6):795-802.
[6]周爽.蟻群算法在高光譜圖像降維和分類中的應用研究[D].哈爾濱:哈爾濱工業大學,2010.
[7]王立國,魏芳潔.APO算法的高光譜圖像波段選擇[J].哈爾濱工業大學學報,2013,45(9):100-106.
[8]KARABOGA D,BASTURK B.On the performance of artificial bee colony(ABC)algorithm[J].Applied Soft Computing,2008,8(1):687-697.
[9]劉穎,谷延鋒,張曄,等.一種高光譜圖像波段選擇的快速混合搜索算法[J].光學技術,2007,33(2):258-261,265.
[10]張蓮蓬,李行,陶秋香.高光譜遙感影響特征提取與分類[M].北京:測繪出版社,2012.
[11]丁勝,袁修孝,陳黎.粒子群優化算法用于高光譜遙感影像分類的自動波段選擇[J].測繪學報,2010,39(3):257-263.
[12]畢曉君.信息智能處理技術[M].北京:電子工業出版社,2010.
(編輯苗秀芝)
Artificial bee colony algorithm-based band selection for hyperspectral imagery
WANG Liguo,ZHAO Liang,LIU Danfeng
(College of Information and Communications Engineering,Harbin Engineering University,150001 Harbin,China)
A hyperspectral image band selection algorithm based on artificial bee colony algorithm isproposed to reducespectralredundancy of hyperspectral remote sensing image and computational complexity.Firstly,accordingtothecorrelationcoefficientmatrices among bands some pretreatments have been taken too btain the band sub space with less relevance.Then,neighborhood search has been implemented on each sub-space by using artificial bee colony algorithm together with the weighted sum between JM distance and OIF as the fitness function.To obtain the optimal band combination,the search is updated until the algorithm is convergent.Finally,the proposed algorithmis used to compare with band selection methods based on ACO,PSO and APO.The experimental results show that the proposed algorithm can not only ensure a good convergence but also reduce the computational cost. Simultaneously,when the obtained bands combination is used for hyperspectral image classification,higher classification accuracy can be obtained.
hyperspectral images;band selection;artificial bee colony algorithm;classification
TN911.73
:A
:0367-6234(2015)11-0082-07
10.11918/j.issn.0367-6234.2015.11.014
2014-09-09.
國家自然科學基金(61275010);國家教育部博士點基金(20132304110007);黑龍江省自然科學基金(F201409);中央高校基本科研業務費重點項(HEUCFD1410).
王立國(1974—),男,教授,博士生導師.
王立國,wangliguo@hrbeu.edu.cn.