張永梅,顧 琳,李 強
(北方工業大學 信息工程學院,北京100144)
判定圖像中是否存在機場目標區域是機場目標檢測的主要任務,是遙感圖像處理的一個重要應用,也是計算機視覺領域與模式識別領域的重要研究方向[1,2]。
由于單一特征無法完整描述目標,可能造成某些具有平行長直線特性 (如道路)或與機場具有相似紋理特征的非機場圖像被檢測為存在機場區域,給后續的識別與變化檢測帶來困難。利用單一特征進行機場目標識別的局限性較大。本文提出一種基于整體特征和局部特征互補的多光譜圖像的機場檢測方法。提取圖像的整體輪廓特征,在整體特征的指導下提取局部特征,建立感興趣機場目標區域的完整特征描述,實現機場目標檢測。
根據目前的研究成果,機場檢測方法大致分為3 類:邊緣提取檢測、區域分割檢測和模板特征點匹配檢測。邊緣提取檢測是根據機場跑道的平行長直線特性,區域分割檢測則是基于機場與周圍地物紋理的差異性,模板特征點匹配檢測是建立機場模型,在原始圖像和待測圖像上相對應的位置提取局部不變特征點并匹配來檢測是否存在機場。一些研究,如張立平和張紅等利用二叉樹辨識通過自適應閾值分割得到的機場感興趣區域,在大場景高分辨率圖像的機場識別中取得了較好的效果[3];周延延和吳曉燕的基于句法的機場檢測方法[4]機場目標檢測率較高。
眾所周知,跑道的直線特性是機場最明顯的特征之一。傳統的機場檢測中,大多數方法也都提取了機場跑道的直線特征[5,6]。此類方法首先對輸入圖像進行去噪操作以減少相關噪聲的干擾;然后利用如Sobel、Canny、Robert等邊緣算子提取圖像的邊緣,對得到的邊緣圖像進行有方向約束的邊緣跟蹤,找出所有可能的直線段,并對這些直線段進行連接,將滿足一定條件的直線段合并成為一條連接線,作為最終的直線提取結果;最后,提取平行直線對 (一般為最長的平行直線對),根據機場的相關先驗知識,進一步驗證是否為機場目標。這類方法的原理比較簡單,軟件實現起來也并不困難,但是在實際情況中機場具有多樣性、復雜性,使得機場的直線特征可能并不是特別明顯,而且在機場周圍也很有可能出現具有直線特征的目標物,基于跑道檢測的機場識別方法具有一定的局限性[7]。
本文方法不同于傳統的機場檢測方法,不依據跑道的直線特征來判定機場區域。本文所提出的機場檢測方法的整體流程如圖1所示。

圖1 本文方法機場檢測的整體流程
首先,對多光譜圖像進行銳化、濾波、分割、形態學處理;然后進行特征提取,提取輪廓特征、紋理特征、顏色特征;最后用SVM 進行分類識別。
圖像能夠直觀、形象地傳遞人們所需要的信息。但是在實際應用中,若對所有的信息都進行加工處理,這將是一個巨大的工程。有選擇性的提取圖像特征,能夠很好地解決這一問題。依據整體和局部的關系,可以將特征分為整體和局部特征[8]。
在提取特征時,整體特征能夠從全局的角度來衡量靜態圖像的特征,常用的整體特征有矩特征、輪廓特征等[9]。局部特征是反映目標區域的特征,常用的局部目標特征有紋理特征、顏色特征、邊緣特征、不變矩特征等[10]。本文選取輪廓特征作為整體特征進行粗分類,進一步提取紋理特征和顏色特征這兩個局部特征進行細分類,從而檢測出感興趣機場區域。
從傳感器獲取的遙感圖像,由于設備的誤差或環境的干擾,會產生一系列的噪聲,使得地物邊緣輪廓部分往往不突出。為了更加充分地利用圖像的輪廓信息,更好地獲取輪廓特征,需要對圖像進行增強處理。增強的目的是為了消除噪聲,顯現那些被模糊了的細節或突出圖像中我們感興趣的特征。圖像增強技術有空間域增強和頻率域增強這兩大類,在實際應用中可根據不同的需要選擇不同的方法。
本文采用的圖像增強處理方法包含的具體實現步驟為:首先,使用拉普拉斯算子對圖像進行銳化操作使其細節變得更加清晰、輪廓得到補償、邊緣及灰度跳變的部分得到增強,從而達到圖像的整體銳化效果;然后,針對拉普拉斯算子銳化增強細節信息而引入的某些高頻噪聲問題,使用3×3的方形滑動窗口中值濾波方法對圖像進行降噪處理,在有效降低噪聲的同時能夠較好地保留圖像的細節。通過這兩個步驟的處理,可以明顯改善圖像的清晰度[11]。選取其中的2組多光譜圖像,效果如圖2所示。
人類視覺在檢測目標的時候,到底是由整體到局部,還是局部到整體呢?特征分析理論認為,視覺從局部開始,逐步形成對整體的描述。拓撲知覺理論認為,局部圖形之間的視覺排列決定了整體要優先于局部。格式塔心理學認為整體大于部分之和,并且決定了部分的感知。Navon認為整體要比局部知覺發生在更早階段。整體特征的提取方法包括圖像分割和特征描述兩部分。特征描述中,輪廓特征具有直觀、簡單,符合人眼觀察目標的機制,所以本文選用輪廓作為描述整體特征的方式。
在遙感圖像中,不同的地物輻射能量值不同。地物的輪廓是輻射能量值發生突變的地方,它標志著一類地物的開始和另一類地物的終結。通過輪廓提取,即可區分不同的地物,得到許多個感興趣目標區域。絕大多數機場都是建立在城市的郊區,而郊區有許多的綠色植被。這是很明顯的不同類地物目標。再者,就機場目標本身而言,它的相對面積比較大。因此,本文首先從整體上提取多光譜圖像的輪廓特征,得到若干個輪廓。用面積值來量化輪廓特征,并假定面積值大于一定像素值的被確定為潛在的機場區域。對圖像進行分割和形態學處理后,提取圖像的輪廓。

圖2 圖像增強效果
分別遍歷篩選出來的符合條件的輪廓圖像pi,并記錄每一個點的坐標pij(xij,yij),其中,xij、yij分別表示圖像pi的第j 個點的橫坐標和縱坐標。找出4 個點對pij(xij,yij),分別為輪廓圖像的最左、最右、最上、最下角的點的坐標。以原圖像的坐標軸為參考標準,以這4個點分別畫出4條直線,形成一個矩形并對應到原圖中,從而得到各個潛在機場區域。原圖像1和原圖像2的各潛在區域如圖3所示。
通過整體的輪廓特征得到機場潛在區域后,并不能非常明確地給出原圖像是否存在機場目標,還需要更進一步地處理。本文在整體特征的指導下,提取局部紋理特征和局部顏色特征。
局部特征是能夠有效區分目標類別,反映目標區域特性的目標特征。常用的局部目標特征包括紋理、邊緣、顏色、不變矩等特征,和整體特征相比,局部特征對目標的描述更加靈活、豐富、高效。

圖3 各個潛在區域
2.3.1 局部紋理特征提取
由于機場目標的特殊性質,在圖像上表現出明顯的紋理特征,紋理特征能從細節上對圖像進行描述。本文采用基于統計分析的紋理特征提取算法灰度共生矩陣,來提取各個潛在機場區域的紋理特征,并采用相關性小的角二階矩、慣性矩、熵、相關性這4個特征值來描述紋理特征。G(i,j)表示灰度共生矩陣,4個特征值的具體定義如下所示

其中,角二階矩 (angular second moment,ASM),又稱為能量 (energy),反映了圖像紋理的粗細度和圖像灰度分布的均勻度。如果共生矩陣中有的值很大,有的值很小,則ASM 值大。慣性矩也稱為對比度 (contrast,CON),表示紋理的清晰度,其計算結果大時,表明圖像的紋理裂溝比較深,圖像看起來就越清晰。熵 (entropy,ENT)表示圖像復雜程度,如果圖像上含有很多細膩復雜的紋理,則表明圖像信息量大,對應的熵也就最大。相關性 (correlation,COR)反映的是圖像中鄰域灰度的相關性[12]。原圖像1的4個潛在區域的紋理特征的特征值見表1。

表1 潛在區域的紋理特征值
從表1的各紋理特征值可以看出,包含真實機場區域的潛在區域4相對于其它3個非機場區域來說,其紋理變化緩慢,灰度分布較均勻,紋理清晰度較高,紋理復雜度低,鄰域灰度的相關性較差。
2.3.2 局部顏色特征提取
HSV 顏色空間中的3個互相獨立的顏色信道,即飽和度、色調和亮度與人眼系統對顏色的感知有著密切聯系,是比較符合人眼對彩色感知的顏色空間之一。人眼系統對色調H 最為敏感,其次是飽和度S,最后是亮度V。利用顏色矩來表示圖像的顏色特征是一種常用而且有效的方法,圖像的顏色分布主要集中在低階矩中。因此,本文分別選取HSV 顏色空間中的色調和飽和度的一階矩和二階矩來表示圖像的顏色特征。
RGB顏色空間到HSV 顏色空間的映射

其中,MAX 是RGB顏色空間中R、G、B三通道分量的最大值和最小值[13]。轉換到HSV 顏色空間后,分離出飽和度和色調兩個通道進行單獨處理,分別提取顏色一階矩和二階矩。顏色一階矩和二階矩的計算公式分別為式(8)和式(9)。

其中,N 表示圖像像素的數目,pij表示圖像的第j 個像素的第i個顏色分量。原圖像1的4個潛在區域的顏色特征的特征值見表2。

表2 潛在區域的顏色特征值
本文使用SVM 分類器對潛在區域進行進一步分析,從而確定是否為感興趣機場目標區域。在經常使用的5 種SVM 核函數中,使用最多的是徑向基 (RBF)核函數,這種核函數廣泛適用于低、高維、小樣本、大樣本的情況,而且它參數少,適用性強。所以本文采用核函數為徑RBF的SVM 分類器判斷該區域是否真的是機場目標區域。關于SVM 的具體介紹請參見文獻 [14]。
將上文提到的輪廓特征、紋理特征和顏色特征組成特征向量來描述這些區域,并輸入到SVM 分類器。對圖3中的各個潛在區域進行識別,識別結果見表3和表4。

表3 原圖像1的檢測結果

表4 原圖像2的檢測結果
其中,表3是對原圖像1的識別結果的統計,表4 是對原圖像2的識別結果統計。從結果可以看出,本文方法能夠有效地對潛在區域進行檢測,明確地給出包含目標機場的區域。
為檢驗本文方法的有效性,選取了100 幅不同區域的多光譜機場圖像進行實驗,并將實驗結果與其它方法對比,對比結果見表5。

表5 機場檢測對比結果
由表5的對比結果可知,本文方法具有較高的機場檢測準確率和較低的誤檢率。
不同于傳統的機場直線特征檢測方法,本文提出一種基于整體特征和局部特征互補的多光譜圖像的機場檢測方法。在整體輪廓特征的指導下提取機場潛在區域的局部特征,能夠有效地檢測出機場區域。而對于機場的準確定位,本文的方法存在不足,有待進一步優化。另外,機場檢測中其它的特征也值得考慮和研究,如具有旋轉不變性和平移不變性的形狀特征。后續工作中,將深入研究這些問題和因素。
[1]KONG Xiangwei,ZHAO Quanshun.The research of airport recognition technology in remote sensing image [D].Dalian:Dalian University of Technology,2011 (in Chinese). [孔祥維,趙全順.遙感圖像中機場識別技術研究 [D].大連:大連理工大學,2011.]
[2]WANG Bin,WANG Xin.The airport detection in remote sensing image based on selective visual attention mechanism[D].Shanghai:Fudan University,2012 (in Chinese). [王斌,王鑫.基于選擇性視覺注意機制的遙感圖像機場檢測[D].上海:復旦大學,2012.]
[3]ZHANG Liping,ZHANG Hong,WANG Chao,et al.The rapid detection method of airport in large and high-resolution SAR images[J].China Image and Graphics,2010,15 (7):1110-1122 (in Chinese).[張立平,張紅,王超,等.大場景高分辨率SAR 圖像中機場快速檢測方法 [J].中國圖象圖形學報,2010,15 (7):1110-1122.]
[4]ZHOU Yanyan,WU Xiaoyan.The authentication methods of target recognition model based on neural network [J].Computer Engineering and Applications,2010,46 (7):145-147(in Chinese).[周延延,吳曉燕.基于神經網絡的目標識別模型驗證方法研究 [J].計算機工程與應用,2010,46 (7):145-147.]
[5]DONG Yinwen,YUAN Bingcheng,SHI Zhaoming,et al.The automatic recognition algorithm of airport runway in aerial imagery based line feature[J].Systems Engineering and Electronics,2013,35 (4):876-879 (in Chinese). [董銀文,苑秉成,石釗銘,等.基于直線特征的航拍圖像機場跑道自動識別算法[J].系統工程與電子技術,2013,35 (4):876-879.]
[6]CHEN Xuguang,LIN Hui.The airport recognition method in remote sensing image[J].Computer Engineering and Applications,2012,48 (25):194-197 (in Chinese). [陳旭光,林卉.遙感圖像中機場目標的識別方法 [J].計算機工程與應用,2012,48 (25):194-197.]
[7]CHEN Ren,ZHAO Guangzhou.The airport target recognition research status at home[J].Micro Computer and Application,2013,32 (11):1-6 (in Chinese). [陳仁,趙廣州.國內機場目標識別研究現狀 [J].微型機與應用,2013,32 (11):1-6.]
[8]Wang X,Lv Q,Wang B,et al.Airport detection in remote sensing images:A method based on saliency map [J].Cognitive Neurodynamics,2013,7 (2):143-154.
[9]SUN Xinghua,LIU Kun.Recognition based on the overall characteristics of human action [D].Nanjing:Nanjing University of Science and Technology,2009 (in Chinese). [孫興華,劉堃.基于整體特征的人體動作的識別 [D].南京:南京理工大學,2009.]
[10]Gonzalez,Alvaro,Bergasa.Text detection and recognition on traffic panels from street-level imagery using visual appearance[J].IEEE Transactions on Intelligent Transportation Systems,2014,15 (1):228-238.
[11]MA Huadong,ZHANG He.The method of text extraction from video based on color clustering and connectivity analysis[D].Beijing:Beijing University of Posts and Telecommunications,2011 (in Chinese).[馬華東,張赫.基于顏色聚類和連通域分析的視頻文本提取方法 [D].北京:北京郵電大學,2011.]
[12]ZHANG Honggang,LIU Lixia.The comparation and study about image texture features[D].Beijing:Beijing University of Posts and Telecommunications,2011 (in Chinese).[張洪剛,劉麗霞.圖像紋理特征研究和比較 [D].北京:北京郵電大學,2011.]
[13]Rafael C Gonzalez,Richard E Woods.Digital image processing [M].3rd ed.Electronic Industry Press,2010.
[14]YANG Hai,SHEN Haibin.The research and application of SVM kernel parameter optimization [D].Zhejiang:Zhejiang University,2014 (in Chinese).[楊海,沈海斌.SVM 核參數優化研究與應用 [D].浙江:浙江大學,2014.]