陳 濱 趙建軍 楊利斌 王 毅
(海軍航空工程學院兵器科學與技術系 山東 煙臺 264001)
基于多尺度核索引字典的飛機目標檢測優化仿真
陳 濱 趙建軍 楊利斌 王 毅
(海軍航空工程學院兵器科學與技術系 山東 煙臺 264001)
為進一步提高基于圖像稀疏表示的飛機目標檢測算法的時間性能與精確度,提出了基于多尺度核索引字典的飛機目標檢測算法,分別從超完備字典結構、目標檢測分類器結構兩方面優化算法。首先引入基于高斯徑向核函數的硬C聚類方法,構造核索引字典,在提升稀疏求解算法時間性能的同時,提高了索引字典原子聚類的準確度。接著基于核索引字典,構建多尺度分類器,進一步提高了算法的效率和精度。實驗表明,在合理選擇聚類數后,采用核索引字典有效降低了稀疏求解算法的時間開銷,原子的聚類準確度有所提高;相對基于單尺度字典的飛機目標檢測算法,基于多尺度核索引字典的算法在時間開銷上平均降低至24.7%,在精度方面,誤檢率平均降低了20.3%,命中率平均提高了3.4%,滿足實時應用要求。
飛機目標檢測 核聚類 索引字典 多尺度 稀疏表示
空中飛機目標識別系統的研究在國內起步較晚,尚處于探索階段。目前已經開展的飛機識別方面的研究,主要是通過提取目標特征,建立相應的數據庫,實現對目標的識別,集中在對遙感圖像中的飛機目標進行識別。
文獻[1]提出了可見光圖像中飛機目標的5個典型識別特征的提取方法,并利用模糊識別方法對飛機目標進行識別。文獻[2]采用融合奇異值分解與中值濾波的方法實現飛機目標圖像的增強,并采用基于邊緣檢測與形態學修復的方法實現飛機目標檢測。文獻[3]提取了訓練樣本圖像庫中飛機圖像特征量建立十類飛機目標的特征庫,并分別用最小距離分類器、神經網絡分類器和樹分類器對樣本圖像庫中的飛機目標進行分類。文獻[4]提出一種基于圖像熵和形狀特征融合的飛機檢測算法,采用圖像熵獲得飛機目標的疑似區域后,將目標的多特征加權融合成新的特征向量,并采用支持向量機來完成遙感圖像中飛機目標的檢測與識別。
在飛機目標識別的關鍵技術中,飛機目標檢測是目標識別、跟蹤等高級應用的基礎[5]。由于飛機目標的高機動性以及天空背景的復雜性,背景差分法、幀差法等傳統目標檢測方法遇到了較大的挑戰。近年來發展起來的稀疏表示理論為目標檢測的研究提供了一種新的思路[6]。
文獻[7]以局部圖像塊為樣本,對不同的樣本訓練單獨的字典使得每類樣本對該類別字典的重構誤差較小。在相同稀疏性約束下,分別采用各類別的字典將測試樣本進行稀疏編碼,并根據重構誤差大小進行判別分類。文獻[8]提出了稀疏表示分類器(SRC),將所有類別的訓練樣本進行組合,得到單個字典,通過計算測試樣本的稀疏系數向量在原字典上進行重構,并計算各類別下的重構誤差,完成目標分類任務。基于上述兩種思路,提升基于稀疏表示目標檢測算法的性能成為了當前研究的熱點。文獻[9]采用最大相關熵準則賦予各像素以不同的權重,對其中遮擋或損毀的區域賦予小權重,降低這部分區域在檢測識別過程中的作用,提高了SRC的魯棒性。文獻[10]對SRC進行改進,通過訓練樣本學習類別子字典來代替原始訓練樣本字典,利用了稀疏系數向量的Fisher準則減小稀疏系數向量的類內方差并增大類間方差,并利用兩者差值構造代價函數,從而使得類別子字典更具判別性。
一些研究將稀疏表示理論應用于飛機目標檢測中。文獻[11] 將飛機圖像識別問題轉化為求解待識別飛機圖像序列關于訓練飛機圖像序列的稀疏表示問題,利用稀疏表示系數對飛機目標識別。文獻[12]構建飛機幾何原子庫并求解飛機輪廓幾何逼近最優化方程,在稀疏表示原理框架下得到飛機輪廓幾何部件的最優組合,并根據顯著圖定位出飛機。
本文對基于稀疏表示的飛機目標檢測算法進行優化,旨在提升目標檢測的時間性能及提高檢測精度。在稀疏求解過程中引入核索引字典,優化字典結構,在提高OMP類算法求解效率的同時,提高索引字典構造的準確度;在圖像塊分類的過程中,通過構造多尺度分類器,減少稀疏求解次數,降低目標分類的總時間開銷,同時利用多尺度的優勢,提高目標檢測的精度。
1.1 圖像的稀疏表示
稀疏編碼的本質是由少量的基向量線性逼近目標向量,其中,基向量空間具有一定的冗余性[13-15]。圖像的稀疏表示以圖像塊為單位。假設圖像塊Ik按行展開形成列向量y∈RN,則Ik可以稀疏表示為:
(1)
其中D=[d1,d2,…,dM]∈RN×M為字典;α為稀疏系數向量,且α=[α1,α2,…,αM]∈RM。當N?M時,字典D為超完備字典。圖像的稀疏表示原理如圖1所示。

圖1 圖像稀疏表示原理
在實際應用中,圖像塊Ik很可能受到環境等因素干擾,無法通過字典準確地線性表示,引入向量ε∈RN×1描述該誤差,如公式所示:
y=Dα+ε
(2)
式(2)矩陣形式為:
y=[D,I][α,ε]T
(3)
其中I是二維單位矩陣,稱為瑣碎模板;ε稱為瑣碎模板系數或噪聲系數。
1.2 目標檢測流程
基于稀疏表示的目標檢測算法一般框架如圖2所示。在預處理過程中圖像完成分塊,作為稀疏求解的輸入;圖像塊依據現有的學習字典進行稀疏求解,將計算得到的重構誤差傳入目標分類過程;分類器依據分類原則將圖像塊分別歸入背景類或前景類中,從而完成圖像中的目標檢測任務,同時根據檢測結果對字典進行更新。可見,要提升目標檢測算法的性能,主要可以針對稀疏求解過程和目標分類過程進行優化。

圖2 基于稀疏表示的目標檢測算法一般框架
本文利用K-SVD[16]算法構造超完備字典。K-SVD利用較小的圖像塊學習超完備字典,具有很強的魯棒性,但在字典的學習階段需要提供大量的訓練圖像塊。
2.1 索引字典原理
圖像的稀疏字典一般表示為矩陣D=[d1,d2,…,dM],列向量di為經過學習后得到的字典原子。在稀疏系數求解過程中,MP類貪婪算法以單個字典原子為對象,依次計算測試圖像塊與字典原子之間的誤差,不斷迭代得到圖像塊的稀疏表示。因此,每次迭代均要遍歷整個字典,才能獲得最佳匹配的原子,從而導致時間開銷巨大。因此,優化字典結構,對于提升稀疏求解的時間性能具有巨大的意義。索引字典通過對字典原子進行聚類,并推選出每個類的代表作為該類的索引,將單層的字典結構改進為雙層字典結構,如圖3所示。

圖3 索引字典原理圖
在索引字典結構下,運用相應算法進行稀疏系數求解時,每次迭代過程先遍歷索引原子集,在誤差最小的索引原子所指向的組內進行遍歷求解,最終得到最佳匹配字典原子,然后進入下一步迭代過程。
在索引字典的結構下進行稀疏求解,良好的聚類結果能夠保證算法獲得全局最優值。但是字典原子作為典型的高維數據,在所在空間中多為線性不可分。文獻[17]直接將適用于低維數據的聚類方法應用在高維數據會導致其有效性大大降低。為此,本文引入核聚類方法構造索引字典,通過核函數將字典原子映射到更加線性可分的特征空間中。
2.2 基于RBF核的硬C均值聚類算法
硬C均值聚類算法(HCM)是一種基于誤差平方和準則的動態聚類算法,將樣本數據點到聚類中心的距離之和作為目標函數,對其進行優化,迭代求極值后將每個數據點分配到唯一的類別中。
高斯徑向基核函數(RBF核)的具體形式如公式所示:
(4)
其中σ為尺度參數,其選取直接影響RBF核的性能:σ→0時,所有樣本將屬于同一類別;σ→∞時,RBF核也會將所有樣本歸入同一類別中。因此針對不同的訓練樣本,選擇合適的σ,將得到更為準確的聚類結果,函數特性如圖4所示。

圖4 RBF核函數特性
RBF核是普適的核函數,經過合理的參數選擇后可以適用于任意分布的樣本,目前應用最為廣泛。在先驗知識缺乏的情況下,RBF核為最佳選擇。

聚類的目標函數為:

(5)
其中‖φ(xi)-φ(cj)‖為特征空間上,數據點與聚類中心的像之間的距離,則有:
‖φ(xi)-φ(cj)‖2=Κ(xi,xi)+Κ(cj,cj)-2Κ(xi,cj)
(6)
由RBF核函數的定義可知Κ(xi,xi)=1,Κ(cj,cj)=1,代入式(6)可得:
‖φ(xi)-φ(cj)‖2=2-2Κ(xi,cj)
(7)
將式(7)代入式(5),得到目標函數的等價形式:
(8)
由此可知,基于RBF核的HCM的聚類準則為:

(9)
其中:
(10)

(11)
由此可得:

(12)
2.3 基于RBF核聚類索引的OMP算法
將核聚類索引字典與OMP算法結合,主要的目的是降低OMP算法求解稀疏系數的時間復雜度,并且利用核聚類的特性,增加字典索引化過程中原子分類的準確性。
結合HCM算法的聚類過程,基于RBF的HCM算法產生索引原子的流程如下:

3) 根據Κ(xi,xk)與式(12)更新得到Κ(t+1)(xi,cj)。

依據上述算法將字典原子{d1,d2,…,dN}進行聚類,并產生索引原子集。基于核索引字典的正交匹配跟蹤算法(KIDOMP)流程如下:
1) 假設待測試圖像塊Iblock按行展開形成列向量yblock。
2) 初始化殘差ri=yblock,i=0,逼近項初始值xi=0,迭代終止誤差ε>0。




8) 置i=i+1,返回3)。
2.4 復雜度分析
假設字典大小為M×N,聚類算法將N個字典原子分配到了k個類中,且在類別j,1 (13) 3.1 多尺度字典學習 由于字典單元的維數等于圖像塊的行列數的乘積,隨著圖像分辨率的增大,檢測圖像的分塊數量也激增,從而導致目標檢測的時耗大大增加。另外,隨著圖像傳感器捕獲圖像質量的提高,圖像的細節更加清晰,為了有效表征輸入的圖像塊,對于字典單元也有了更高的要求。因此,對高分辨圖像進行稀疏表示及分類適合采用大尺度字典,但卻會導致稀疏系數求解時間增加,無法滿足實際應用要求。通過降低圖像分辨率,采用低分辨率條件下學習得到的小尺度字典構造分類器,對目標進行檢測能夠有效減少時間復雜度,但是這種做法在一定程度上降低了目標檢測精度,對后續應用造成不利影響。 2) 將Bhigh、Blow、A分別作為K-SVD的訓練集,學習得到大尺度背景字典Dhigh、小尺度背景字典Dlow及飛機目標字典Dplane。 3) 將Dhigh、Dlow、Dplane索引化。 3.2 基于多尺度分類器的飛機目標檢測 Dlow負責構建粗分類器,將低分辨率條件下的背景圖像塊篩除,獲取包含前景區域的低分辨率圖像塊。Dhigh負責構造精分類器,將粗分類得到的前景圖像塊對應的超分辨率圖像區域進行分塊并分類,篩除超分辨率背景圖像塊,獲得前景圖像區域。背景的多尺度分類器,共同完成天空背景與前景的分割任務。Dplane構造的分類器對前景目標進行分類,確定目標是否屬于飛機目標。 基于多尺度分類器的飛機目標檢測算法流程如圖5所示,具體描述如下: 1) 對測試圖像進行隔點采樣,降低分辨率,獲得低分辨率測試圖像,并對其進行分塊。利用小尺度背景分類器進行分類,分別歸入小尺度背景、前景兩類。利用獲取的小尺度背景圖像塊更新Dlow。 2) 計算1)中獲取的小尺度前景圖像塊在超分辨率測試圖像中對應的區域,再次進行分塊。利用大尺度背景分類器,將新的圖像塊分別歸入大尺度背景、前景兩類。利用獲取的大尺度圖像塊更新Dhigh。 3) 將2)中獲取的大尺度背景圖像塊,通過飛機目標分類器進行分類,歸入飛機目標、其他前景目標兩類。根據飛機目標圖像塊更新Dplane。 圖5 飛機目標檢測流程 3.3 復雜度分析 作如下假設: 1) 測試圖像分辨率為P×Q; 2) 大尺度圖像塊大小為Nhigh×Nhigh,小尺度圖像塊大小為Nlow×Nlow; 3) 大尺度字典單次稀疏系數求解時間為Thigh,小尺度字典單次稀疏求解時間為Tlow; 4) 降低圖像分辨率時,進行隔M1點采樣;超分辨率圖像的行列均插值至測試圖像的M2倍; 5) 低分辨率圖像塊中前景圖像塊所占比例為k1,對應超分辨率圖像區域中前景圖像塊所占比例為k2。 基于多尺度分類器的飛機目標檢測主要由三個過程構成: 因此,在多尺度分類器條件下,飛機目標檢測的時復雜度為: (14) 本文仿真環境具體如下: 操作系統為Windows XP,仿真軟件為Matlab 2014b,處理器為Inter Core2 E7500,內存為2 GB。實驗訓練集及測試集均取自某型戰機飛行視頻。 為驗證優化算法在時間性能和精度上的改進,設計實驗如下: 實驗1:基于核索引的超完備字典實驗。以OMP算法的稀疏求解結果作為標準,計算基于不同核函數的索引字典稀疏求解結果,獲得稀疏求解的準確度;計算基于核索引超完備字典的OMP的算法平均時間開銷。 實驗2:基于多尺度分類器的飛機目標檢測實驗。驗證基于多尺度分類器的檢測算法在時間開銷方面的表現;通過計算檢測命中率、誤檢率來評價算法在精度方面的表現。 4.1 實驗1 由于OMP算法采用貪婪思想,在稀疏求解每次迭代時,需要遍歷字典的每一個原子,將其作為MP類算法準確度的評判標準具有可行性。實驗利用不同訓練集學習得到兩個不同字典D1、D2,冗余度為3,核函數的參數設置如表1所示。 表1 核函數參數設置表 實驗結果如表2所示。 表2 索引準確度結果表 可見,在索引字典的結構下,基于RBF核構造的字典準確度最高,表明該核函數對圖像塊變換的高維向量有良好的聚類效果。 聚類類別數的選擇對時間性能具有較大的影響,實驗選擇了100個測試圖像塊,分別作用于原始字典、類別數分別為2、5、20、100的核聚類索引字典,時間開銷如圖6所示。 圖6 系數求解耗時圖 可見,核索引字典對于提升稀疏求解算法的時間性能具有明顯的作用,且聚類數K對改進效果有很大的影響。由于實驗1結果中,當K=20時,算法時間開銷最小,為此實驗2中選擇K=20構造索引字典。 4.2 實驗2 實驗測試集為某型戰機飛行視頻中的100幀連續圖像,對圖像中的飛機目標進行檢測,部分檢測結果如圖7所示。 圖7 飛機目標檢測結果圖 顯然,基于多尺度分類器的飛機目標檢測算法相比單尺度分類器,獲得的飛機目標區域更為精確。 為量化評價算法的有效性,實驗從時間性能、命中率和誤檢率三個方面,對下列兩個條件下的算法性能進行了比較: 1) 原測試圖像、單層字典、單尺度分類器。 2) 多分辨率測試圖像、核索引字典、多尺度分類器。 命中率與誤檢率的定義如下: 實驗結果分別如圖8-圖10所示。 圖8 算法耗時圖 圖9 目標檢測命中率 圖10 目標檢測誤檢率 由表3所示,基于多尺度核索引分類器的飛機目標檢測算法在時間性能上較單尺度算法有了很大的提升,經過計算,單幀圖像完成目標檢測的平均時耗降低至24.7%;優化算法在精度上同樣有了一定程度的改進:單幀圖像的平均命中率提高了3.4%,平均誤檢率降低了20.3%。 表3 目標檢測算法評價對比 本文從優化字典結構、分類器結構兩個方面對基于稀疏表示的飛機目標檢測算法進行了優化,實驗表明: 1) 在字典結構優化上,基于RBF核索引字典的OMP算法在時間性能上有了較大程度的提升,且基于RBF核的硬C均值聚類算法保證了字典原子聚類的準確度相比基于歐氏距離的算法有所提高。 2) 在分類器優化上,基于多尺度核索引分類器的飛機目標檢測算法相比基于單尺度分類算法,時間性能及精度方面的表現均有了較大程度的提升。 [1] 王樹國,黃勇杰,張生.可見光圖像中飛機目標的特征選擇及提取[J].哈爾濱工業大學學報,2010,42(7):1056-1059. [2] 趙蓓蕾.空中飛機目標圖像增強與辨識研究[D].西南科技大學,2014. [3] 李科.自動識別遙感光學圖像中飛機目標的研究[D].長沙:國防科技大學,2005. [4] 高琪琪.遙感圖像飛機目標檢測與識別算法研究[D].南昌航空大學,2015. [5] Liu G,Sun X,Fu K,et al.Aircraft recognition in high-resolution satellite images using coarse-to-fine shape prior[J].IEEE Geoscience and Emote Sensing Letters,2013,10(3):573-577. [6] 高仕博,程詠梅,肖利平,等.面向目標檢測的稀疏表示方法研究進展[J].電子學報,2015,43(2):320-332. [7] Mairal J,Bach F,Ponce J,et al.Discriminative learned dictionaries for local image analysis[C]//Computer Vision and Pattern Recognition,2008.CVPR 2008.IEEE Conference on.IEEE,2008:1-8. [8] Wright J,Yang A Y,Ganesh A,et al.Robust Face Recognition via Sparse Representation[J].IEEE Transactions on Pattern Analysis & Machine Intelligence,2009,31(2):210-227. [9] He R,Zheng W S,Hu B G.Maximum Correntropy Criterion for Robust Face Recognition[J].IEEE Transactions on Pattern Analysis & Machine Intelligence,2011,33(8):1561. [10] Yang M,Zhang L,Feng X,et al.Fisher Discrimination Dictionary Learning for sparse representation[C]//IEEE International Conference on Computer Vision,ICCV 2011,Barcelona, Spain, November.DBLP,2011:543-550. [11] 李萍,王樂,張波.改進稀疏表示的飛機目標識別算法[J].電光與控制,2016(7):50-54. [12] 林煜東,和紅杰,尹忠科,等.基于稀疏表示的可見光遙感圖像飛機檢測算法[J].光子學報,2014,43(9):196-201. [13] Elad M.Sparse and redundant representations: from theory to applications in signal and image processing[M].Springer Publishing Company,Incorporated,2010. [14] Skretting K,Engan K.Recursive least squares dictionary learning algorithm[J].IEEE Transactions on Signal Processing,2010,58(4):2121-2130. [15] Mairal J,Bach F,Ponce J,et al.Online Learning for Matrix Factorization and Sparse Coding[J].Journal of Machine Learning Research,2010,11(1):19-60. [16] Aharon M,Elad M,Bruckstein A.K-SVD:an algorithm for designing overcomplete dictionaries for sparse representation[J].IEEE Transactions on Signal Processing,2006,54(11):4311-4322. [17] Han Jiawei,Kamber M.數據挖掘:概念與技術[M].2版.范明,孟小峰,譯.機械工業出版社,2007. OPTIMIZATIONANDSIMULATIONOFAIRCRAFTTARGETDETECTIONBASEDONMULTI-SCALEKERNELINDEXDICTIONARY Chen Bin Zhao Jianjun Yang Libin Wang Yi (DepartmentofWeaponScienceandTechnology,NAEI,Yantai264001,Shandong,China) In order to improve the time performance and accuracy of aircraft target detection algorithm, we propose an aircraft target detection algorithm based on multi-scale kernel index dictionary. The algorithm is optimized from the construction of dictionary and classifies of object detection. First, the RBF kernel was introduced into the HCM algorithm to construct the indexed dictionary. Time performance was improved as well as the accuracy of clustering. Then, the multi-scale classifier was constructed based on the kernel index dictionary to further improve the efficiency and accuracy of the algorithm. As experiments show, after choosing a reasonable number of clusters, kernel-based indexed dictionary has decreased the time consumption of sparse solution. The accuracy of clustering has increased at the same time. Compared with the single scale dictionary, the algorithm based on the multi-scale kernel index dictionary reduces the time cost to 24.7%. In the respect of accuracy, the false detection rate decreased by an average of 20.3%, and the average hit rate increased by 3.4%. In conclusion, the proposed algorithm can satisfy the requirement of real-time application. Aircraft target detection Kernel-based clustering Indexed dictionary Multiscale Sparse representation 2016-12-14。陳濱,博士生,主研領域:目標檢測與跟蹤。趙建軍,教授。楊利斌,講師。王毅,講師。 TP391.41 A 10.3969/j.issn.1000-386x.2017.11.037
3 目標檢測分類器優化




4 實驗及結果










5 結 語