晁安娜,劉 坤
(上海海事大學 信息工程學院,上海 201306)
基于卷積神經網絡的遙感圖像飛機目標識別*
晁安娜,劉 坤
(上海海事大學 信息工程學院,上海201306)
遙感圖像的識別技術一直被廣泛運用于民用和軍事領域。針對采集到的遙感飛機圖像存在大量干擾,如遮擋、噪聲、視角變化等因素,提出一種改進的基于卷積神經網絡的遙感圖像目標識別算法。在復雜環境下,運用卷積神經網絡對飛機目標進行識別,避免了在特征提取過程中信息的丟失,提高了識別率。實驗結果證明了該算法在遙感圖像飛機目標識別中的可行性,能克服尺度變化及目標姿態變化等因素的影響。同時提出的算法較傳統CNN、BP神經網絡和支持向量機(SVM)方法具有更好的識別效果,魯棒性更強。
卷積神經網絡;深度學習;遙感圖像;飛機識別
遙感圖像飛機識別在民用和軍事領域都具有重大意義。目前對飛機目標識別的方法有很多種,例如特征點和不變矩、模板匹配、特征融合等。傳統的飛機目標識別算法通常采用模板匹配[1],它具有算法簡單、計算量小的特點,但過程簡單,提取圖像中飛機的完整形狀在現實環境中非常困難,且不能適用于飛機目標的尺度變換。目前飛機目標識別領域應用最廣泛的方法是利用不變矩,具有代表性的不變量特征提取方法有Hu矩[2]、Zernike距[3]、小波距[4]等。現主要采用優化組合矩[5]對飛機目標進行識別,將提取的多維不變矩作為識別特征,再使用支持向量機(SVM)來識別飛機目標,可以克服單一特征描述信息能力不強的特點,但多特征融合困難,抗噪性較差。BP神經網絡[6]具有良好的學習能力和泛化能力,但由于學習速率固定,學習步長及動量因子難以確定,使得網絡收斂速度慢,糾錯能力有限,甚至導致算法收斂于局部極小值。
由于實際采集到的遙感飛機圖像較復雜,視角變化、噪聲、云層遮擋等干擾因素會導致較高的誤識率。本文提出一種基于卷積神經網絡的遙感圖像飛機識別算法,在傳統CNN結構上加以改進,通過海地機場6類遙感飛機圖像進行多組實驗,仿真結果證明將卷積神經網絡運用在飛機識別上不僅克服了遮擋、光照和視點變化等因素,提高了抗噪性,而且魯棒性和識別精度都得到了提升。
1.1卷積神經網絡簡介
卷積神經網絡(Convolutional Neural Networks,CNN)[7]是人工神經網絡與深度學習的結合。傳統意義上的多層神經網絡只有輸入層、隱藏層、輸出層,且隱藏層較難確定。而卷積神經網絡在原來多層神經網絡的基礎上,加入部分連接的卷積層與池化層,來模仿人腦對信號處理上的分級。
卷積神經網絡通過局部感受野和權值共享減少訓練參數和計算的復雜度,這種網絡結構對旋轉、尺度縮放或者其他形變具有穩定性,成為人臉檢測與文字識別等領域的研究熱點。CNN采用一種改進的基于梯度的反向傳播算法,在減少權值數量的同時降低了網絡結構的計算復雜度。該網絡結構無需傳統識別方法中繁雜的特征提取與重建,避免數據的丟失,圖像可以直接輸入網絡。
1.2卷積神經網絡模型結構
傳統CNN模型LeNet為5層[8],本文采用的卷積神經網絡較傳統CNN在結構上的改進如下:為了避免初始參數飽和,緩解梯度消失,在每層卷積層和全連接層都采用修正線性單元(Rectified Linear Unit,ReLU)替代原來的Sigmoid函數;基于遙感飛機圖像的特點,要更多地保留紋理信息而忽略背景信息,在池化層采用最大二均值池化替代均值池化和最大池化;為了增強泛化能力,提高網絡的稀疏性和隨機性,防止過擬合,在全連接層加入DropConnect[9],設置概率為0.6。
本文所采用的卷積神經網絡共11層,包括5個卷積層、3個池化層、2個全連接層和1個Softmax層。卷積核大小分別為11, 5, 3, 3, 3;特征圖個數分別為20, 40, 60, 80, 80;池化窗口為2×2。在全連接層加入概率為0.6的DropConnect,Softmax輸出層包含224個節點。針對6類飛機的分類結果,設置輸出神經元個數為6。本文所采用的卷積神經網絡結構如圖1所示。

圖1 本文卷積神經網絡結構
卷積過程:將一個可訓練濾波器kj與一個輸入圖像(開始是輸入圖像,隨后是卷積特征圖)進行卷積,之后加上偏置bj,獲得卷積層Cj。通常,卷積層的形式如下所示:
(1)
其中:j表示第j張特征圖;l表示層數;k表示卷積核;f表示激勵函數ReLU,f(x)=max(0,x);Mj表示輸入特征圖的一個選擇;b表示偏置。
池化過程:選取池化域內中值依次最大的兩個元素求和,池化的特征值為和的平均數。最大二均值池化的一般形式為:
(2)

在卷積神經網絡的遙感飛機識別算法實現中,以其訓練過程最為重要。網絡的訓練過程主要分為前向傳播和后向傳播兩個階段[10]。該網絡的算法流程圖如圖2所示。

圖2 卷積神經網絡遙感飛機目標識別算法流程圖
卷積神經網絡進行遙感飛機目標識別的訓練過程如下:
(1)建立一個飛機圖像庫(包括訓練圖像和測試圖像),并對各類飛機圖像進行預處理,如尺度縮放、旋轉、仿射變換、加噪、運動模糊和遮擋等。
(2)初始化CNN網絡結構和參數設置,設置訓練集中各個模式下輸出單元i到隱藏單元j的權值Vij,隱藏單元i到輸出單元j的權值Wjk,輸出單元閾值θk,隱藏單元閾值φj置成接近于0的隨機值,精度控制參數ε和學習率α初始化為0.01α。
(3)定義層之間的相關矩陣,讀取訓練數據,即從樣本集中選取樣本(X,Xk),將X數據讀取到網絡中。
(4)訓練網絡,即計算輸入點乘每層對應的權值矩陣,得出實際輸出Yk:
Yk=Fn(…(F2(F1(xkW(1))W(2))…)W(n))
(3)
通過比較網絡訓練后的實際輸出Yk與目標輸出Ok的差值,計算第k個樣本的輸出誤差值Ek,即:
(4)

(5)根據誤差值,按極小化誤差的方法反饋網絡,依次計算各權值和閾值的調整量:
權值的調整量:

(5)

(6)
其中:L表示中間層的單元數;N表示輸入層單元數;δk表示輸出誤差項,δk=(ok-yk)yk(1-yk)。
閾值的調整量:
(7)

(8)

(6)根據計算得到的調整量,依次調整權值和調整閾值:
調整權值:
Wjk(n+1)=Wjk(n)+ΔWjk(n)
(9)
Vij(n+1)=Vij(n)+ΔVij(n)
(10)
調整閾值:
θk(n+1)=θk(n)+Δθk(n)
(11)
φj(n+1)=φj(n)+Δφj(n)
(12)
(7)重復以上步驟,直至誤差指標滿足精度要求:E≤ε,其中E是總輸出誤差,定義為:
E=∑EK
(13)
(8)訓練結束,保存達到精度要求的相關權值和閾值。
(9)讀取處理過的測試圖像,測試網絡,輸出各遙感飛機識別結果,并評定網絡精度及穩定性。
實驗以MATLAB仿真實現,本文所采用的飛機遙感圖像來自于某些海地機場的IKONOS衛星圖像。為了驗證該算法的可行性和有效性,從中選取了海地機場的6類飛機目標各個角度的灰度圖像進行實驗,包括A-10攻擊機、B-2轟炸機、B-52轟炸機、E-A預警機、F-15戰斗機和F-16戰斗機。樣本圖像中每種機型各角度圖片有1 000幅,測試圖像中每種機型各視角圖片有100幅,每幅圖像大小為256×256,圖像像素值明顯大于Mnist庫(手寫數據庫)[11]。為了得到更好的識別結果,圖像均經過二值化處理。圖3為這6種類型的二值圖像。

圖3 海地機場6類飛機目標的二值圖像
為了驗證該算法的可行性,將每種飛機類型輸入網絡,迭代次數設置為20,將20次的平均誤差作為測試結果。實驗結果如表1所示。

表1 各類飛機目標的識別結果
由以上結果可知,將CNN運用在遙感飛機目標識別鄰域具有較高的識別率,并且對于各種類型的飛機目標,識別結果較為穩定,證明了本文算法的可行性。
為了驗證該算法的抗噪性,考慮到遙感飛機目標識別的實際應用環境。實際圖像易受到視角變化、噪聲干擾、云層遮擋等影響,故對圖像進行了尺度縮放、旋轉、仿射變換,還加入了不同等級的高斯白噪聲、運動模糊和不同位置的遮擋。下面列出6組飛機圖像經過一系列變換的仿真圖(以A-10攻擊機為例),如圖4~圖9所示,重復上述實驗方法,得到實驗結果如表2所示。

圖4 尺度縮放0.5

圖5 旋轉30°

圖6 仿射變換0.15

圖7 加噪聲 0.02

圖8 運動模糊

圖9 任意位置遮擋

飛機類型訓練樣本數測試樣本數識別率/%A?10攻擊機700070093.31B?2轟炸機700070097.58B?52轟炸機700070091.78E?A預警機700070096.54F?15戰斗機700070095.98F?16戰斗機700070092.53平均識別率/%94.62
從以上識別結果可以看出,在圖像加入各種類型的變換及干擾后,識別率稍有下降。對于B-52轟炸機來說,其外形結構易受到環境的影響,故識別結果下降較大;而對于B-2轟炸機,其穩定的三角形狀使得識別結果較為穩定。總的來說,整體的識別率還是維持在較高的水平上,可見該算法能克服視角變化、噪聲干擾、云層遮擋等影響,抗噪性強。
為了驗證算法的魯棒性,在測試圖像中加入非該類型飛機及其他類似圖像作為干擾項,每種類型各增加300幅干擾圖片。繼續重復上述實驗方法,得到實驗結果如表3所示。

表3 干擾因素下各類飛機目標的識別結果
從表3可以看出,在測試圖像中加入了干擾項后,各種遙感飛機類型的識別結果雖有所波動,但對識別率的影響很小,識別精度較穩定,魯棒性強。
為了驗證算法的識別效率及精度,在加入復雜環境及干擾因素的情況下,將該算法與傳統CNN算法、BP結合D-S證據理論算法[12]及支持向量機(SVM)[13]的分類方法進行比較。其中BP結合D-S證據理論的多特征融合算法是基于Hu矩、仿射不變量等特征;采用SVM分類方法進行分類時,分別提取飛機目標的骨架約束的角點、幾何矩不變量等特征,并加權融合所有特征。實驗對比結果如表4 所示。

表4 其他算法與本文CNN算法的復雜度對比
為了簡化描述并更直觀地顯示對比結果,用A、B、C、D、E、F分別代表A-10攻擊機、B-2轟炸機、B-52轟炸機、E-A預警機、F-15戰斗機和F-16戰斗機,對比圖如圖10所示。

圖10 本文算法與其他識別算法中每類飛機的正確識別率對比
從上述表1~表4及圖10能夠明顯看出,本文算法較傳統CNN在識別精度上有了較大的提高;同時較SVM方法避免了復雜的特征提取及信息的缺失;相對于傳統的BP神經網絡,不僅減少了權值的數量,降低了網絡模型的復雜度,而且大大減少了識別時間,提高了識別精度。
本文提出了一種基于卷積神經網絡的遙感圖像飛機目標識別算法,對激勵函數、池化模型和正則化模型進行了改進,提高了網絡的稀疏性和隨機性。該算法對遙感圖像中飛機目標存在的尺度縮放、傾斜、仿射變化等其他形式的變形和噪聲干擾、云層遮擋等復雜背景環境具有較高的抗噪性、魯棒性及識別精度。
本文所提出的遙感圖像識別算法具有良好的容錯性、并行處理能力以及自學習能力,這些優勢使其適用于復雜的飛機遙感圖像的處理,在實際應用中有較大的研究價值。在后續研究實驗中,會根據實際應用情況,增加識別的飛機目標類型數,拓寬在不同背景環境下的應用,同時對網絡結構及算法進行進一步的改進,以提高算法的識別率和魯棒性。
[1] AZZOUZ E E, NANDI A K. Automatic identification of digital modulation types[J]. Signal Processing, 1995, 47(1):55-69.
[2] HU M K. Visual pattern recognition by moment invariants[J]. IRE Transactions on Information Theory, 1962, 2(8):179-187.
[3] TEAGUE M R. Image analysis via the generaltheory of moments[J]. Journal of the Optical Society of America, 1980,70(8):920-930.
[4] Shen Dinggang, IP H H S. Discriminative wavelet shape descriptors for recognition of 2-D patterns[J]. Pattern Recognition, 1998, 32(2):151-165.
[5] Zhu Xuefeng, Ma Caiwen. The study of combined invariants optimization method on aircraft recognition[C]. 2011 Symposium on Photonics and Optoelectronics (SOPO),IEEE,2011:1-4.
[6] Fang Zixuan, Yao Guoqing, Zhang Yanan. Target recognition of aircraft based on moment invariants and BP neural network[C]. World Automation Congress, 2012:1-5.
[7] LAWRENCE S, GILES C L,TSOI A C, et al. Face recognition: a convolutional neural-network approach[J]. IEEE Transactions on Neural Networks, 1997, 8(1):98-113.
[8] 徐鵬,薄華.基于卷積神經網絡的人臉表情識別[J].微型機與應用,2015,34(12):45-47.
[9] Wan Li, ZEILER M, Zhang Sixin, et al. Regularization of neural networks using dropconnect[C]. International Conference on Machine Learning, 2013,28(3): 1058-1066.
[10] 龔丁禧,曹長榮.基于卷積神經網絡的植物葉片分類[J].計算機與現代化,2014 (4): 12-15.
[11] 許可.卷積神經網絡在圖像識別上的應用研究[D].杭州:浙江大學,2012.
[12] 楊福平,白振興.BP神經網絡和D-S證據理論的目標識別[J].火力與指揮控制,2006,31(10):88-90.
[13] 李平,魏仲慧,何昕,等.采用多形狀特征融合的多視點目標識別[J].光學精密儀器,2014,22 (12):3368-3376.
2017-03-31)
晁安娜(1992-),女,碩士研究生,主要研究方向:智能信息處理與模式識別。
劉坤(1982-),女,博士,副教授,主要研究方向:多尺度集合分析理論、稀疏表示以及壓縮感知等圖像處理技術。
Aircraft target recognition in remote sensing image based on CNN
Chao Anna, Liu Kun
(College of Information and Engineering, Shanghai Maritime University, Shanghai 201306, China)
Remote sensing image recognition has been widely used in civil and military fields. In view of plenty of interference factors in remote-sensing aircraft, such as shade, noise, the changing of perspective, etc, an improved target recognition algorithm in remote sensing image based on convolution neural network is proposed. Convolution neural network is adopted to recognize aircraft target in complex environment to avoid information loss in the process of feature extraction, which improves recognition rate. Simulation results show that the feasibility of aircraft target recognition algorithm in remoting sensing image and the scale and posture changes of target can be overcome. Meanwhile, the proposed algorithm has higher recognition effect and stronger robustness than traditional CNN and BP neural network and support vector machine (SVM) methods.
convolution neural network; deep learning; remote sensing image; aircraft recognition
TP391.9
A
10.19358/j.issn.1674- 7720.2017.22.018
晁安娜,劉坤.基于卷積神經網絡的遙感圖像飛機目標識別J.微型機與應用,2017,36(22):66-69,73.
航空科學基金(2013ZC15005)