郭志民,孫玉寶,耿俊成,周 強
1(國網河南省電力公司 電力科學研究院,鄭州 450052 2(南京信息工程大學 信息與控制學院,江蘇省大氣環境與裝備技術協同創新中心,南京 210044)
近年來,遙感成像技術發展迅速,高光譜圖像的空間與光譜分辨率越來越高.與傳統的多光譜圖像不同,高光譜圖像中每個像素通常由幾十至幾百個光譜波段組成,形成連續的光譜曲線,包含更加豐富的光譜信息,能夠更加準確地判別每個像素所反映的地物類別,因此在電力監測、電力規劃、土地測繪、農業等領域的應用也越來越廣泛.然而,高的光譜分辨率在帶來優點的同時,也引入了一些新的挑戰.第一個挑戰是維數災難問題.高光譜圖像的標注代價昂貴,而每個像素通常位于幾百維的高維空間中,很容易導致“維數災難”現象[1].第二個挑戰是信息冗余問題.高光譜傳感器是在電磁波譜上進行的稠密采樣,使得高維光譜特征具有很大的相關性.這種冗余的信息不僅會帶來計算和存儲的損耗,還會降低分類性能[2].
降維是解決以上問題的常用方法之一[3-5].在高光譜圖像處理中,波段選擇和特征變換是兩種最常用的降維方法.波段選擇[6,7]的目的是從給定波段中篩選出一個子集,以捕獲盡可能多的有效信息.而特征變換嘗試將原始的光譜波段按照一定的準則投影到一個維度更低的子空間中,如主成分分析[8]和線性判別分析[9,10]等方法.主成分分析旨在最大化投影之后的數據方差,而線性判別分析則期望最大化類間散度矩陣并最小化類內散度矩陣.不同于這兩種方法,局部流形保持投影[11]旨在保持相鄰數據間的幾何結構.在文獻[12]中,保局投影被成功地應用于高光譜圖像分類中.
近年來,圖模型在遙感圖像分析中得到了非常廣泛的關注[13,14].構造圖的關鍵在于確定鄰接關系和計算圖中任意兩點間的權重.其中,k近鄰法和ε球面鄰域法是常用來建立鄰接關系的兩種方法[15,16],而“高斯核”函數則是廣泛采用的計算頂點間權重的方法.為了更好地構建圖模型,一些改進的方法逐漸涌現出來.例如,在文獻[17]中,Wang和Zhang將非負局部線性重構系數作為邊的權重,充分利用了每個鄰域的幾何結構信息.類似地,Liu等人提出了基于彈性網稀疏表示的圖權重計算方法[18],該方法能夠很好地編碼數據的判別信息,并同時確定圖模型的鄰接關系和邊權重.
對于高光譜圖像分類而言,盡管圖模型能夠取得一定的效果,但已有的模型大多只考慮了光譜特征,而忽視了空間上下文信息.隨著成像光譜儀技術的不斷更新,現有的傳感器獲得的高光譜影像往往還具有非常高的空間分辨率.因此,局部區域的像素點通常隸屬同一目標物體.對于一個較大的均勻區域,內部的像素點可能具有不同的光譜響應.如果僅使用光譜特征,這些像素點可能會被劃分到不同的子區域中,顯然會帶來一定的問題.相反,對于多個相鄰的區域,如果僅使用空間信息,則這些區域很可能被劃分到同一個區域中.綜上所述,融合光譜和空間信息有利于獲得更為精確的結果.
現有的組合光譜和空間上下文信息的方法大致包含三種不同類型:特征級融合、決策級融合以及基于正則化的融合[2].特征級融合技術首先分別提取光譜特征和空間特征,然后將這些特征串聯成向量或構建核函數[19,20]后再送入分類器.決策級融合技術首先利用光譜和空間信息得到多個預測結果,然后利用投票方法等策略將這些結果組合在一起[21].基于正則化的融合技術通常利用空間信息構建一個正則項,加入到原始的目標函數中[22].
本文提出了一種基于譜-空圖嵌入降維的多核融合分類算法(如圖1所示),屬于特征級融合方法.該算法主要由三個步驟組成:首先,將訓練集中的每個像素點作為頂點,每個頂點用對應像素的光譜特征描述,以此構造一個光譜圖,利用圖嵌入模型求得一個低維投影矩陣;其次,利用主成分分析模型提取高光譜圖像的第一個主成分,并將其劃分成不同大小的超像素塊,以每個超像素塊為頂點,每個頂點用超像素塊中所有像素點的平均值來描述,從而構造一個空間圖,使用圖嵌入模型再次求得一個低維投影矩陣;最后,對于高光譜圖像中的每個像素點,可用兩個不同的投影矩陣分別求得其對應的低維特征表示,利用多核學習的方法對兩者進行融合,自適應學習兩種特征的融合權重,可提升后續SVM分類的準確性.

圖1 本文算法框圖
假設矩陣X=[x1,x2,…,xn]∈Rm×n表示由n個數據組成的訓練集,其中,m為每個數據的特征維度.降維的目的是利用給定的數據將X∈Rm×n投影為Y∈Rd×n,其中,d?m.給定投影矩陣V,線性降維可表示為:Y=VTX.
圖嵌入模型基于譜圖理論,旨在保持數據之間的幾何結構,其目標函數可以寫成如下形式:
(1)
式(1)中,yi和yj分別表示樣本xi和xj的低維投影,權重矩陣W中元素wij表示xi和xj之間的連接權重,若頂點間沒有連接,則權重wij=0.
為了去除尺度的影響,圖嵌入模型通常需要添加額外的約束項,比如VTXDXTV=I.因此,(1)式可以重新寫成如下形式:

(2)
式中,tr(·)表示矩陣的跡,D為對角矩陣,其對角元素為Dii=∑jwij,L=D-W為圖拉普拉斯矩陣.式(2)的解可通過求解泛化的特征值問題獲得:
XLXTV=λXDXTV
(3)
針對高光譜圖像中豐富的譜-空信息,本文提出了一種譜-空圖嵌入模型.首先,分別利用光譜和空間信息構造兩個不同的圖:光譜圖和空間圖.然后,利用圖嵌入模型提取每個像素的光譜特征和空間特征.最后,利用多核學習的方式對光譜和空間特征進行有效融合.

為了減少光譜信息間的冗余性,本文采用圖嵌入模型對光譜特征進行進一步提取.具體而言,以H中的像素為頂點構造一個光譜圖,任意兩個頂點xi和xj之間的權重通過“熱核”函數求解:
(4)
其中,N(xj)表示xj像素的k個最近鄰像素,t為“熱核”函數的尺度參數.由式(4)中求得的wij可推導出光譜圖拉普拉斯矩陣L1,代入式(2),可得投影矩陣V1.
類似地,可以通過H中的空間信息構造一個空間圖.由于H中通常包含不同大小和形狀的目標物體,因此采用固定大小的空間鄰域進行特征提取很容易造成信息的丟失.基于超像素的方法[23]能夠很好地解決此類問題,每個超像素的大小和形狀可根據局部結構信息自適應地調整.過分割是形成超像素塊的常用方法,受文獻[24]啟發,本文采用基于熵率的超像素分割方法生成超像素[25].為了減少計算量,首先利用主成分分析模型提取H的第一個主成分H1∈Rw×h,然后采用文獻[25]中的方法對H1進行過分割,整個過程如圖2所示,其中白色的分割線即為超像素的輪廓.
在得到超像素后,以它們為頂點,構建空間圖.圖中任意兩點的權重同樣可由式(4)求得,此時xi和xj為第i和第j個超像素中所有像素的平均值.最后,利用式(2),可得第二個投影矩陣V2.對于H中的任意一個像素點xk∈Rm,其光譜和空間特征可分別表示為:
(5)
譜-空特征融合的主要目標是通過多核方法自動地學習融合權重d1和d2,使得生成的融合特征為:
(6)
(7)

(8)
式(8)可看作一個典型的多核學習問題.為了同時優化融合權重d1和d2,以及拉格朗日乘子αk和αl,本文采用Simple MKL算法[26]進行求解.
進一步本文依據一對多(one-verse-all)策略,由(8)式訓練C個二分類SVM,其中第i(1≤i≤c)個SVM分類器將輸入樣本分類為第i類與非i類.要判別測試樣本屬于哪一類,需把該樣本分別代入C個SVM分類器中,取值最大的那個類別就是測試樣本所屬類別,進而實現C類樣本的分類.高光譜圖像的譜-空圖嵌入與多核分類算法完整流程如下:
算法1.譜-空圖嵌入的高光譜圖像多核分類算法
輸入參數:高光譜圖像H∈Rw×h×m及其類別標簽,
Step1.構建光譜域圖,由(4)式計算光譜圖權種矩陣;
Step2.由(2)式求解得到光譜域投影矩陣V1;
Step3.采用熵率分割生成超像素,構建空域圖,計算空間圖權種矩陣;
Step4.根據(2)式求解得到空間域投影矩陣V2;
Step5.根據(5)式計算降維后的光譜和空間特征
Step6.由(6)式生成降維后的融合特征;
Step7.由(7)式計算融合權重與SVM分類器(二分類)
Step8.依據一對多策略,訓練C個SVM分類器
輸出:投影矩陣V1,V2,C個SVM分類器(二分類)
為了驗證本文方法(簡稱SSGE)的有效性,本實驗在兩個通用的數據集上進行了測試.第一個數據集為Indian Pines(IP),該數據由AVIRIS傳感器觀測美國印第安納西北部地區所得,獲取時間為1992年6月12日.原數據包含224個光譜波段,去除4個含有0值的波段以及20個受噪聲干擾的波段,利用剩余200個波段進行實驗.該圖像的空間分辨率為20米,大小為145×145,每個像素對應一定類型的地面覆蓋物,總共包含16種,如Alfalfa(苜蓿)、Corn(玉米)、Wheat(小麥)等等.圖3(a)展示了由波段57,27和17組成的三波段偽彩色圖.表1給出了IP數據集中樣本分布情況,第二列為數據集中各類地物所包含的樣本總數,并將其分為訓練集與測試集.第二列與第三列分別給出了后續實驗中針對各類像素所使用的訓練樣本數與測試樣本數.

圖3 IP數據集(a)與PUS數據集(b)的偽彩色圖

表1 IP數據集中樣本分布情況
第二個數據集為Pavia University Scene(PUS),該數據為ROSIS傳感器于2002年7月8日,觀測意大利北部帕維亞大學所得.原影像包含115個光譜通道,覆蓋了0.43微米的可見光波段到0.86微米的紅外波段.去除含有噪聲的波段,利用其它103個波段進行實驗.圖像大小為610×340,空間分辨率為1.3米.圖3(b)了三波段(90,60和40)偽彩色圖和類標圖.表2詳細記錄了PUS數據集各類樣本(如:Asphalt(瀝青)、Meadows(草地)等)的分布情況以及實驗中所使用的訓練樣本數與測試樣本數.

表2 PUS數據集中樣本分布情況
為了驗證本文SSGE算法的性能,與四種不同的方法進行了對比,即廣泛使用的主成分分析法(簡稱PCA)、光譜圖嵌入法(簡稱SpeGE)、空間圖嵌入法(簡稱SpaGE)以及串聯光譜圖嵌入特征和空間圖嵌入特征法(簡稱SpeSpa).對于這些方法,降維后的數據維度為5到50之間.分類器選用支持向量機模型[20],核函數選用徑向基核函數,其參數采用交叉驗證的方法從候選值{10-3,10-2,…,103}中進行篩選.式(4)中的參數t和k分別設為1和5.所有算法的分類性能通過整體分類準確率(OA)、平均分類準確率(AA)、每類分類準確率和Kappa系數進行度量.

圖4 不同方法在IP數據上準確率隨維度的變化

圖5 不同方法在PUS數據上準確率隨維度的變化
圖4和圖5展示了四種算法的OA在兩個數據集上隨維度的變化情況.從中可以看出,不同方法的OA隨著維度的提高先呈現增長的趨勢而后趨于穩定,因為維度過低時,會造成判別信息的丟失,而維度過高時又會存在信息冗余的情況.與PCA和SpeGE相比,在相同的維度下,SpaGE能夠獲得更高的準確率,說明對于這兩幅高光譜圖像,空間信息比光譜信息更重要.此外,將光譜信息與空間信息直接串聯在一起,獲得的分類結果與SpaGE接近,并沒有充分發揮兩種特征的優勢.與之不同,當用多核學習融合兩種特征時,SSGE能進一步提升分類性能,充分證明了本文算法的有效性.

表3 不同方法在IP數據集上的分類結果

表4 不同方法在PUS數據集上的分類結果

圖6 不同方法在IP數據上的可視化結果
為了驗證算法的每類分類結果,表3和表4測試了當數據維度降為40時,不同方法的分類準確率,黑色加粗字體表示同一類中最高的分類結果.與其它方法相比,SSGE在大部分類中都能獲得最高的分類結果,進一步證明了SSGE算法的優越性.此外,圖6和圖7對分類結果進行了可視化,圖6(a),圖7(a)分別給出了兩個數據集的真實類標圖(ground-truth),對比真實結果,SSGE能夠獲得更加平滑均勻的結果,異常點明顯少于其它幾種算法.

圖7 不同方法在PUS數據上的可視化結果
本文提出了一種譜-空圖嵌入的降維算法,用于有效提取并融合高光譜圖像的光譜和空間信息.利用光譜信息和空間信息分別構造光譜圖和空間圖,再將構造的圖送入圖嵌入模型進行特征提取,最后使用多核學習的方式將提取到的光譜和空間最優地組合起來,從而得到良好的分類效果.本文的分類算法可推廣應用于電力監測、電力規劃等領域,提供有效的地物分類支撐.