黃 霄 云紅全 徐 力 鞠 雯 明德烈
(1.華中科技大學自動化學院多譜信息處理技術國家級重點實驗室 武漢 430074)(2.宇航智能控制技術國家級重點實驗室 北京 100854)(3.北京航天自動控制研究所 北京 100854)
在高分辨率遙感圖像中,目標擁有豐富的特征信息,這為基于遙感圖像的目標可識別性分析提供了可能。一般而言,遙感圖像的目標主要分為線性目標、復雜結構目標和團塊目標[1]。由于不同的目標類型以及對目標描述方法的不同,其所得到的特征在識別性能上也有很大的差異。為了克服單一特征在識別性能上的片面性和局限性,文獻[2]將形狀和顏色兩種特征進行了組合應用;文獻[3]融合了顏色、紋理以及GIST 等特征,這些改進都在一定程度上提高了算法的性能。
為綜合各類型特征的優勢,實驗以分組融合的方式同時應用Gabor、LPQ、HSV、LBP、GIST、HOG 6種特征,并進行特征層面和分類器層面的融合以提高可識別性分析的性能??紤]到高分辨率遙感圖像各類目標之間差異較大,本文將主要對遙感圖像中的團塊目標(飛機、車輛、船舶等)的可識別性展開研究。
1)HSV顏色直方圖
HSV顏色特征可以比較直觀地描述圖像內容,是遙感圖像的一個重要認識特征,有著眾多的實踐與證明[4]。HSV 顏色空間是一種基于感知的顏色模型,它把圖像顏色信息分為三個屬性:色調、飽和度和亮度。為實現HSV 顏色直方圖特征的提取,需將圖像從RGB 轉換到HSV。對三個分量執行非等間隔的量化:根據人類視覺的辨別能力,將色調空間分為8 區間,飽和度和亮度均分為3 區間。然后根據色彩的不同范圍和主觀色彩感知執行非等間隔的量化,最后統計其的直方圖分布,完成HSV顏色直方圖特征的提取。
2)Gabor紋理特征
Gabor小波核函數具有與人類大腦皮層簡單細胞的二維反射區相同的特性,它能夠捕捉對應空間尺度、空間位置及方向選擇性等局部結構信息,在計算機視覺和圖像分析領域得到廣泛的應用[5]。Gabor 濾波器[6]是一個由二維高斯函數衍生出的復數域正弦曲線函數,相當于一組帶通濾波器,由其獲得的Gabor 紋理特征是一種不依賴于顏色或亮度的視覺特征,具體提取方法如下:使用5個尺度8個方向的Gabor 濾波器對原始圖像進行Gabor 變換,可以形成40幅圖像紋理表示,再計算這40幅圖像的均值和方差從而得到一個80維的特征向量。
3)LBP紋理特征
LBP(Local Binary Pattern,局部二值模式)是一種用來描述圖像局部紋理特征的算子,它具有旋轉不變性和灰度不變性等顯著的優點,在遙感圖像的也有著各種應用[7]。原始的LBP 算子[8]定義為在3*3 的窗口內,以窗口中心像素為閾值,將相鄰的8個像素的灰度值與其進行比較,若周圍像素值大于中心像素值,則該像素點的位置被標記為1,否則為0。這樣,3*3 鄰域內的8 個點經比較可產生8 位二進制數,其十進制值即為該像素點的LBP值。特征描述中,以直方圖的形式統計出每個像素點的LBP 數值,并將其作為整幅圖的LBP 紋理特征向量。
4)LPQ紋理特征
LPQ 算子是一種具有模糊不變性的紋理特征描述算子。對于圖像f(x),M×M 領域Nx采用離散的短時傅立葉變換[9],如式(1)所示:

其中u表示頻率。
局部傅立葉系數通過4 個頻點u1=[a,0]T,u2=[0,a]T,u3=[a,a]T,u4=[a,-a]T來計算,a 表示很小范圍,a=1/M.對于每個像素位置,通過向量表示。

傅立葉系數相位可以通過每個部分的實數和虛數的符號來表示。

其中gj是向量G( x )=[Re{ F ( x )},Im{F(x)}]的第j個部分。然后qj對其進行二進制編碼,如式(4)所示:

經過LPQ 算子運算后形成LPQ 圖像,然后轉化成LPQ直方圖,將其作為特征的表達。
5)HOG形狀特征
方向梯度直方圖(Histogram of Oriented Gradient,HOG)特征[10]是一種在計算機視覺和圖像處理中用來進行物體檢測的特征描述子。它通過計算和統計圖像局部區域的梯度方向直方圖來構成特征。HOG 特征的主要思想是,在一副圖像中,局部目標的表象和形狀能夠被梯度或邊緣的方向密度分布很好地描述,而梯度主要存在于邊緣的地方。HOG 特征的提取主要由四個步驟組成:(1)顏色空間歸一化;(2)梯度計算;(3)梯度方向直方圖;(4)重疊塊直方圖歸一化,最后獲得HOG特征。
6)GIST視覺特征
GIST 特征[11]用以實現對該信息的客觀描述。該特征模擬人的視覺,形成對外部世界的一種空間表示,捕獲圖像中的上下文信息。GIST 特征的實現過程如下:(1)通過多尺度多方向Gabor 濾波器組對場景圖像進行濾波;(2)將濾波后的圖像劃分為n×n 的網格;(3)各個網格采用離散傅里葉變換和窗口傅里葉變換提取GIST 特征;(4)將第(3)步中每個網格中產生的特征值級聯起來,就得到了整幅圖像的GIST特征。
1)Gabor_LPQ
Gabor 紋理特征和LPQ 紋理特征都是對圖像紋理的描述。Gabor 紋理特征,在提取目標的局部空間和頻率域信息方面具有良好的特性,但存在全局表征能力弱以及特征數據維數冗余的問題。LPQ 紋理特征,可對整個圖像的輪廓進行描述,具有良好的識別結果。
考慮到Gabor 濾波器的局部優勢及LPQ 算子的整體能力,因此聯合Gabor 紋理特征和LPQ 紋理特征實現互補,完成目標可識別性分析[12]。如圖1所示。

圖1 Gabor_LPQ特征處理
2)LBP_HSV
LBP 特征是基于灰度空間的圖像局部紋理特征描述算子,它不隨灰度尺度的變化而變化,在不同光照的影響下魯棒性好,具有良好的灰度不變性和旋轉不變性等優點。
HSV 顏色直方圖是基于HSV 空間的全局特征,特別適用于難以進行自動分割的圖像,與LBP特征相比具有全局性的特點。
3)HOG_GIST
HOG 提取的是圖像局部輪廓特征,由于它在圖像的局部細胞單元上進行操作,所以它對圖像幾何形變和光學形變能保持良好的不變形,這能很好地應用到對于物體的檢測。GIST 提取的是圖像的全局特征,二者有一定的互補。

圖2 HSV_LBP特征處理
1)Adaboost分類器
AdaBoost 是一種迭代算法,它被評為數據挖掘十大算法之一[13],其核心思想是針對同一個訓練集訓練不同的分類器,即弱分類器,然后把這些弱分類器集合起來,構造一個更強的最終分類器[14]。
算法本身是改變數據分布實現的,它根據每次訓練集之中的每個樣本的分類是否正確,以及上次的總體分類的準確率,來確定每個樣本的權值。將修改權值的新數據送給下層分類器進行訓練,然后將每次訓練得到的分類器融合起來,作為最后的決策分類器。
2)決策樹算法
決策樹(decision tree)是一種基本的分類與回歸方法。決策樹模型呈樹形結構,在分類問題中,表示基于特征對實例進行分類的過程。它可以認為是if-then規則的集合,也可以認為是定義在特征空間與類空間上的條件概率分布。其主要優點是模型具有可讀性,分類速度快。學習時,利用訓練數據,根據損失函數最小化的原則建立決策樹模型。預測時,對新的數據,利用決策樹模型進行分類。決策樹學習通常包括3 個步驟:特征選擇、決策樹的生成和決策樹的修剪。
決策樹算法很多,例如:ID3 算法[15]、C4.5 算法、CART 算法等。這些算法均采用自上而下的貪婪算法,每個內部節點選擇分類效果最好的屬性來分裂節點,可以分成兩個或者更多的子節點,繼續此過程直到這棵決策樹能夠將全部的訓練數據準確的分類,或所有屬性都被用到為止。
特征分組融合的可識別性分析實驗主要包括學習階段和預測階段,其主要步驟如下:
1)學習階段
(1)選定正負樣本:選取具有飛機、車輛以及船舶等團塊目標的圖片作為訓練的正樣本,選取無團塊目標的隨機圖像作為訓練的負樣本。正樣本數為2400個,負樣本數為2400個,并以此作為訓練集數據;
(2)針對訓練集分別提取Gabor、LPQ、HSV、LBP、GIST、HOG等特征,訓練并獲取相應的特征組Adaboost分類器;
(3)將分類器模型應用于測試數據,計算并保存其預測模型中間值,每個測試數據對應三個分類器的中間值P1,P2,P3,并以此作為其屬性描述;
(4)將分類器的預測中間值P1,P2,P3作為決策樹算法的輸入屬性進行訓練,獲得Gabor_LPQ、HSV_LBP、GIST_HOG三個分類器的融合規則。

2)預測流程
(1)提取待分析圖像的Gabor_LPQ 特征、HSV_LBP特征、GIST_HOG特征;
(2)針對不同的特征使用相應的Adaboost分類器計算預測中間值;
(3)將獲得的預測中間值運用Gabor_LPQ、HSV_LBP、GIST_HOG 三個分類器的融合規則進行預測,獲得對應的結果。

圖4 訓練流程圖

圖5 預測流程圖
識別率是正確識別樣本數與樣本總數的比值,是衡量識別算法性能的最重要指標。實驗通過分別提取Gabor、LPQ、HSV、LBP、GIST、HOG 等6 種特征,并將其得到的識別率與Gabor_LPQ、HSV_LBP、GIST_HOG 等3 種融合特征的識別率進行對比,分析特征融合對識別率的影響。然后,在此基礎上,將三種融合特征分類器的分析結果與三種分類器融合的結果進行對照分析,得到分類器融合對識別率的提升效果。
利用單個特征進行Adaboost 學習和分類預測的結果如下圖所示,其中橫軸表示迭代的輪數,縱軸表示當前分類器在測試集上的識別正確率,實驗過程中用到了三種Adaboost 方法,分別為Gentle Adaboost、Modest Adaboost以及Real Adaboost。

圖6 Gabor adaboost迭代提升圖

圖7 LPQ adaboost迭代提升圖

圖8 HSV Adaboost迭代提升圖

圖9 LBP Adaboost迭代提升圖

圖10 GIST Adaboost迭代提升圖

圖11 HOG Adaboost迭代提升圖
通過分析可知,Gentle Adaboost 和Real Adaboost 的適應能力較強,性能比Modest Adaboost 更穩定,以下對比實驗將僅使用Real Adaboost方法進行。
為了進一步分析特征組合對識別率的影響,分別將Gabor 和LPQ 特征,HSV 和LBP 特征,GIST 和HOG 特征進行融合,然后選用Real Adaboost 方法實現訓練學習。如圖12~14 所示,分別為Gabor_LPQ、HSV_LBP、GIST_HOG 融合特征迭代訓練提升圖。

圖12 Gabor_LPQ融合特征迭代訓練提升圖

圖13 HSV_LBP融合特征迭代訓練提升圖

圖14 GIST_HOG融合特征迭代訓練提升圖
通過分析可知,三組融合特征得到的識別率均高于利用單一特征進行學習的識別率,即得到結論:基于優勢互補的特征融合有利于提高Adaboost算法的識別率。
最后,使用CART 決策樹算法將Gabor_LPQ、HSV_LBP、GIST_HOG 三個分類器進行融合,并把得到的分析結果與上述實驗進行對比。表1 記錄了6 個單特征和3 組分組融合特征使用Real Adaboost方法時,第200輪以及迭代過程中最高的識別率。最后一行的數據為已得的三個分類器進行CART融合時在同一測試集上的識別率。

表1 單個、分組以及分類器融合識別率對比表
實驗結果表明,基于多特征分組融合的可識別算法的識別率高于單特征或組合特征判別算法,該算法能夠同時綜合Gabor_LPQ、HSV_LBP、GIST_HOG 特征的優點,將目標識別率提高到97%以上。