張 劉, 葉 楠, 馬靈玲, 汪 琪, 呂雪瑩, 章家保*
1. 吉林大學儀器科學與電氣工程學院, 吉林 長春 130061 2. 中國科學院空天信息創新研究院中國科學院定量遙感信息技術重點實驗室, 北京 100094
由于高光譜數據量十分龐大, 受限于通信帶寬和處理速度, 往往無法實時傳輸處理全部數據。 對于有實時處理需求的任務, 高光譜載荷通常僅實時下傳數個譜段進行快速處理。 因此, 如何選擇有代表性的譜段, 使得在選出的波段子集上能高精度地完成實時地物分類和目標檢測任務, 是高光譜遙感應用中待解決的一大問題[1-2]。
高光譜圖像波段選擇的機理可看成是一個非線性函數求解極值點問題。 近年來, 許多優化方法應用到高光譜波段選擇上, 例如遺傳算法[3-4]、 差分算法[5]、 杜鵑搜索[6]、 蟻群算法[7]、 粒子群算法[8-9]等。 Clerc[10]將混合編碼差分算法與粒子群算法結合用于高光譜圖像降維。 王立國等[7]利用蟻群算法結合遺傳算法進行高光譜波段選擇, 認為是一種兼顧時間效率和精解效率的有效方法。
粒子群優化算法是一種仿生自然現象的元啟發式算法, 具有結構簡單、 參數少易于操作、 搜索速度快的優勢。 Ding[8]將粒子群算法應用在高光譜波段選擇中, 但受限于傳統粒子群算法易陷入局部極值和早熟的問題, 所選取的波段不是全局最佳值。 為了解決該問題。 高鷹等[11]將模擬退火算法與PSO算法結合(SAPSO), 通過模擬退火算法的“概率突跳特性”使傳統粒子群算法具有了跳出局部極值的能力, 但其產生新解的鄰域仍集中在局部區域內, 降低了對新解的利用率, 同時在針對高維復雜函數全局尋優時, SAPSO易出現早熟和穩定性差的問題[12]以致于無法尋找到全局最優值。
針對傳統粒子群算法易陷入局部極值和穩定性較差問題, 提出了一種改進粒子群優化算法(MPSO), 在利用模擬退火-粒子群算法中“概率突跳特性”的同時結合“淘汰機制”豐富種群的多樣性, 有望提高算法的全局搜索能力和穩定性, 以更加精準、 高效地檢索到高光譜有效波段。 充分考慮高光譜數據中不同地物的類間距離構建了優化目標函數, 采用改進粒子群算法進行全局尋優, 以更精確的選取出波段組合。
種群由i個粒子組成, 每個粒子攜帶D維信息, 粒子當前位置視為優化問題中的一個可行解, 粒子的移動僅與位置和速度相關, 分別用xit和vit表示粒子的位置和速度
(1)
其中,Ld和Ud為粒子可行解范圍的上限和下限。
(2)
式(2)中,vmin和vmax為粒子搜索速度的上限和下限。
為獲取優化的最佳解, 所有粒子需要不斷的進行迭代以更新種群的位置和速度, 速度和位置的更新公式如式(3)和式(4)所示
(3)
(4)

通過粒子的速度更新公式可知, 在搜索過程中所有粒子僅向全局最優值和自身歷史最佳值的方向步進, 在迭代后期種群中的粒子趨向于同一位置, 粒子失去活躍度, 最終幾乎以“零速度”步進, 算法的全局尋優性能降低。
為彌補傳統粒子群優化算法的缺陷, 首先引入模擬退火中的“概率突跳特性”, 在尋優過程中引入的隨機因素, 使算法具有跳出局部極值的能力。
由式(3)可知, 粒子在迭代的最初階段具有較大的速度, 在全局范圍內進行大面積搜索以確定最優解的可能范圍, 在迭代后期粒子將在小鄰域范圍開展深度搜索。 若每次迭代新解優于當前解, 則新解完全被接受, 反之, 以一定概率接受新解, 以Metropolis準則定義解的接收程度, 由式(5)表示。
(5)
但是在迭代后期, 新解的范圍仍然集中在相鄰區域, 降低了算法對新解的利用率。
為解決此問題, 引入了淘汰機制, 若種群搜索新解的范圍一直局限于某個區域內, 則將此解淘汰, 選取其他粒子補充到種群中, 通過擴大新解的搜索范圍保持種群的多樣性。 同時隨著解之間差異的縮小接受壞解的概率也隨之減小, 以種群中新解與當前解之間的趨近程度作為評判標準, 評判標準取經驗值1.00×10-9。 若種群新解與當前解整體的趨近程度小于預設值時, 則淘汰新解并在種群中補充新粒子。 當新解與當前解之間的數值差異較大時, 保留新解的概率變大, 擴大了搜索范圍, 進而提升了算法的全局搜索性能。 其過程如圖1所示。

圖1 淘汰機制的過程
當將粒子群算法應用于高光譜波段選擇時, 每個粒子代表一種波段的組合數, 粒子的位置和速度則分別代表了波段的組合在種群中的可行解以及向下一個更優的可行解時步進的速度。
高光譜波段選擇及驗證主要由三部分組成: (1)高光譜圖像數據處理模塊; (2)波段選擇優化模塊; (3)地物分類模塊。 具體流程為: 首先, 在高光譜三維圖像的全波段數據中隨機選出n個波段, 將三維圖像數據轉換為二維數據, 在n個波段中按一定比例隨機選取各類地物數據作為波段選擇的仿真數據。 其次, 經由優化模塊進行循環迭代, 得到高光譜最佳組合波段用于表征地物特征。 最后, 將篩選出來的波段組合傳輸到地物分類模塊中, 利用已知的數據真實標簽值來計算其分類精度, 判定本波段選擇方法的有效性。 改進粒子群的高光譜波段選取的算法流程如下:
輸入: 高光譜圖像X
輸出: 篩選出的波段組合數
開始:
(1)設置初始參數: 函數上界UB, 函數下界LB, 種群大小PopSize, 微粒的維數Dim, 學習因子值C1, C2, R1, R2, 慣性權重初始值w_start, 慣性權重終值w_end, 粒子的最大速度vmax, 最大迭代次數MaxIter;
(2)產生初始種群;
(3)采用JM距離判斷初始最佳波段子集;
循環:
(4)重新計算目標函數值;
(5)保留候選波段子集;
(6)更新粒子的速度和位置;
(7)以一定的概率接受壞解;
(8)如果新解與當前解之間的趨近程度小于預設值, 淘汰新解并在種群中補充新粒子;
(9)得到當前最佳波段子集;
(10)若不滿足預設收斂條件返回步驟(4), 反之, 停止迭代;
(11)輸出高光譜圖像的最佳波段子集。
結束
為了提高分類的準確度, 構建目標函數應考慮不同地物之間的類間距離, 根據兩地物之間的均值以及協方差矩陣選擇以Jeffries-Matusita[13](JM)距離為目標的優化函數, 當兩類地物的JM距離值較大時, 則兩類地物為同種地物的可能性越小, 當兩類地物的JM距離越小時, 則兩類地物為同種地物的可能性越大, 即兩類地物間的特征向量區別越小。
(6)
(7)
(8)
式中, meani, meanj和Ci,Cj分別代表高光譜數據中的第i類和第j類的數據均值和協方差矩陣,s為高光譜數據中的地物種類。
將目標函數設定為
(9)
(1) 第一組高光譜數據場景是由美國加利福尼亞州圣地亞哥的機載可見/紅外成像光譜儀(AVIRIS)在印第安納州西北部的印度松測試點上收集到的數據, 場景由145×145像素和224個光譜通道組成, 涵蓋200~2 400 nm的光譜范圍。 去除吸水區域波段后, 選取200個波段用于實驗, 由印度松(Indian Pines)的第10, 20, 30波段合成的高光譜彩色影像如圖2(a)所示。
(2) 第二組高光譜數據是由美國加利福尼亞州圣地亞哥的機載可見/紅外成像光譜儀(AVIRIS)在加利福尼亞州薩利納斯山谷測試點上收集到的數據, 由512×217個像素和224個光譜通道組成。 去除吸水區域波段后, 選取204個波段用于實驗, 由薩利納斯(Salinas)的第10, 20, 30波段合成的高光譜彩色影像如圖2(b)所示。

圖2 高光譜彩色影像
采用Indian Pines和Salinas兩組標準數據開展了改進粒子群波段選擇方法的有效性驗證, 所有實驗平臺均以matlab2018a軟件在Windows10平臺上以Intel(R)Core(TM)1.8GHZ處理器8GRAM64位的電腦上運行。 將改進粒子群算法(MPSO)與傳統粒子群算法(SPSO)、 模擬退火—粒子群算法(SAPSO)和遺傳-粒子群算法[14](IEPSO)進行了比較。
2.3.1 基于改進粒子群波段選擇方法的穩定性能仿真測試
為滿足目前載荷下傳波段大多數為3波段的需求, 利用兩組數據進行實驗, 以驗證改進粒子群算法的適應性和穩定性。 數據從Indian Pines場景中選擇Grass-pasture-mowed, Oats, Soybean-mintill, Wheat, Buildings-Grass-Trees-Drives五種地物、 Salinas場景中選擇Brocoli_green_weeds_2, Fallow_rough_plow, Stubble, Grapes_untrained, Corn_senesced_green_weeds五種地物。
為公平起見, 每種算法的仿真數據和測試數據均采用相同樣本, 分別隨機選取它們樣本數量的20%作為波段選擇仿真數據(訓練數據), 其余80%的樣本數量作為后續分類的測試數據。 全部運行十次, 四種算法的目標函數值迭代收斂圖如圖3所示。

圖3 四種算法目標函數的收斂圖
由圖3可知, MPSO算法的迭代次數在50次內即可停止收斂, 繼承了SPSO收斂速度快的優點的, 保留了SAPSO算法的深度搜索能力的基礎上保證了種群的多樣性, 增強了全局尋優能力。 MPSO算法在仿真實驗中的收斂精度和收斂速度均高于其他三種算法, 篩選的高光譜的波段具有更高的分類精度。
同時為了驗證本算法的穩定性, 分別計算了三種算法運行十次的均值與方差, 如表1所示。

表1 四種算法的均值和方差值
由表1中的高光譜數據的仿真實驗結果可知, MPSO算法均值在兩組數據中的分別可以達到13.840 9和14.130 0, 表明其尋優能力優于其他三種算法; 方差分別為1.477 8×10-4和0, 在四種算法中的方差值最小, 且在第二組數據中其方差值可以達到0值, 這就說明了MPSO的穩定性很高, 對比其他三種方法具有一定的優勢。
2.3.2 基于改進粒子群最佳波段選擇分類精度仿真測試
為了驗證基于改進粒子群算法篩選出的波段子集的地物分類精度和魯棒性, 采用相同的訓練數據和測試數據, 采用支持向量機[15](SVM)將實驗選出來的波段子集用于地物分類, 同時SVM的徑向基函數作為支持向量機的核函數, 采用10倍交叉驗證法選擇支持向量機的參數。 選取波段選擇中所用到的20%仿真數據作為訓練樣本, 剩下的80%數據作為測試樣本。
四種方法篩選出的最佳波段子集以及在支持向量機分類器中的性能指標結果分別如表2和表3所示。

表2 四種算法選擇的波段

表3 數據分類的性能指標
通過對兩組高光譜數據仿真實驗進行分析, 根據不同的波段選擇方法, 分別獲取了不同的波段組合數的高光譜三波段數據圖像, 并對波段選擇后的圖像進行了SVM的分類, 并依次記錄了本算法與三個比較算法的OIF指數與Kappa系數。 從分類精度來看, 本文提出的MPSO算法均優于其他三種算法。
Indian Pines和Salinas兩組高光譜的數據分類圖分別如圖4和圖5所示。

圖4 Indian Pines分類圖

圖5 Salinas分類圖
由于通信帶寬和處理速度的限制, 往往無法實時傳輸處理全部數據。 高光譜數據的各波段之間具有很強的相關性, 通過波段選擇算法對原始數據進行降維, 在提高了時效性的同時也保證分類精度。 從信息處理時效性的角度來看, 通過粒子群優化算法來降低數據維數有很大的現實意義。 首先利用淘汰機制結合模擬退火-粒子群算法的突跳性優點增強了對目標函數最優值的探索能力, 同時大大的增加了算法的穩定性能, 通過對JM距離的評判, 隨后對篩選出的波段組子集進行分類; 通過與其他物種算法的對比, 顯示出本算法的有效性。 實驗結果表明基于改進粒子群算法的高光譜波段選擇方法不僅能滿足光譜波段下傳能力, 且對特定目標實現了高精度分類要求, 對于高光譜圖像的目標識別和地物分類具有一定的借鑒意義。 后期將進一步研究目標函數以及分類器的優化設計, 提高數據的分類精度。