舒亞海,賈倩茜,張 超,周 元
(1.海軍裝備部駐上海地區第一軍事代表室,上海 201000;2.中國船舶集團有限公司第八研究院,南京 211153)
空中目標的識別在近代軍事戰場具有重大意義和廣泛應用前景,是戰場態勢評估和威脅估計的基礎,也是指揮自動化系統的重要組成部分。對于紅外圖像的目標識別,主要難點在于:一是如何使提取的特征具有很好的目標表征能力;二是特征向量的提取和模式識別的方法。
近年來,隨著小波理論的逐漸成熟,小波變換也越來越多地被應用在目標識別領域。但是,小波變換反映的是信號的點奇異性,無法精確描述圖像邊緣的方向,也無法實現對圖像的稀疏表示,從而影響識別精度。而多尺度幾何分析方法正是為了克服小波這一局限性而產生的。該方法對圖像中的幾何特征的表達更加優于小波,并且能隨尺度變化,對圖像進行連續逼近。因此,本文采用了該分析方法中的Contourlet變換提取圖像的特征向量。它能夠在任意尺度上實現任意方向的分解,擅長描述圖像中的輪廓信息,故其分解后的低頻系數能很好地表征目標的基本特征,而高頻系數可以表征目標的細節信息,彌補了小波變換不足。
目前,目標識別的方法很多,有的應用角點特征和核聚類算法,有的基于閉合輪廓特征,有的采用模板匹配等等。神經網絡具有自組織、自適應學習功能,由具有非線性映射能量的神經元組成。神經元之間同通過權值系數相連,能夠并行計算,因而具有速度快的優點。同時,由于信息分布存儲于連接權系數中,使得神經網絡對圖像光照變換、像素部分損失、飛行目標姿態變化等問題不敏感,能高辨識率地完成圖像識別。
Contourlet變換是一種基于非分離型濾波器組實現的圖像多尺度幾何分析工具,其思想是通過類似于輪廓段(Contoursegment)的基結構來逼近圖像,其算法繼承了小波的多分辨和時頻局部化特性,同時又兼具良好的方向性和各向異性。而二維小波是由一維小波張量積構建得到,它的基缺乏方向性,不具有各向異性,只能限于用正方形支撐區間描述輪廓,不同大小的正方形對應小波的多分辨率結構。[1]
對于一個二次連續可微的目標函數f,如果是其重構函數,而m是其系數重量,則Contourlet變換時誤差逼近滿足
而采用小波變換時誤差逼近滿足
由此可看出,Contourlet變換比小波變換具有更好的逼近能量,對圖像中的曲線、直線具有更“稀疏”的表達,更有利于對紅外圖像進行預處理提取特征信息。
如圖1所示,Contourlet分解是由拉普拉斯金字塔式分解和方向濾波器組實現。對目標圖像進行Contourlet變換可以利用其優良特性更好地提取原始圖像中的幾何特征,從而得到一個低頻子帶系數和各尺度各方向的高頻子帶系數。
在工程研究中通常會遇到一些復雜的非線性系統。這些系統狀態方程復雜,難以用數學方程準確建模,而適用于神經網絡表達這些非線性系統。該方法把系統看成是一個黑箱,用系統輸入輸出數據訓練神

圖1 Contourlet分解示意圖
經網絡,使神經網絡能夠擬合輸入參數和輸出參數的關系,其實質是一個隱含的數學表達式,即f(y)=f(x1,x2, …)。輸入參數和輸出參數直接聯系,改變輸入參數的數值,就能得到相應的輸出,而模型的結構不會發生改變。[2]
由于BP神經網絡具有處理非線性輸入輸出關系的能力,并能不斷學習,利用BP網絡可以實現離線數據的在線修正。輸入數據通過BP神經網絡的各層到達輸出層后比較輸入輸出的差值是否達到,如果沒有達到則返回各層不間斷調整各層權值,以達到期望的輸出。
BP神經網絡具有一層或多層的前饋網絡[3],對實例訓練是通過利用輸出層誤差沿著與輸入信號相反的方向逐級反向傳遞來自動獲取知識。一般有輸入層、中間層、輸出層,各層順次連接,結構示意圖如圖2所示。

圖2 BP神經網絡結構示意圖
前饋型神經網絡的中間層一般可包含有一至多個隱藏層。隱藏層的非線性傳遞函數神經元可以學習輸入輸出之間的線性和非線性關系,采用多個隱藏層數或增加隱藏層的節點數均可提高網絡精度。但是,隱藏層增多或隱藏層節點數增多都會增加網絡自學習的時間,影響效率,不利于識別方法的推廣。[4]若隱藏層節點數太少,訓練時間雖然變短,但可能訓練不出來或容錯性大。調整隱藏層節點的個數可用來達到目的。
本理論模型目的在于提供一種機動目標識別方法。該方法對紅外圖片庫中機動目標圖像進行幾何重構,再使用Contourlet變換的多尺度分析方法提取圖像低頻特征向量和高頻特征向量,以低頻特征為原始輸入參數,通過BP神經網絡訓練以高頻特征向量修正模型,快速有效地實現對不同機型、多種飛行姿態、不同光照明暗變化下的飛行目標進行識別。
圖像的幾何重構主要包括圖像預處理和對飛行目標姿態的重構。圖像預處理是提高識別精度的重要一步,目的是將圖片進行歸一化處理,并去除圖像中不相關背景環境的影響,凸顯待識別的目標區域。分為兩步,第1步進行圖片幾何標準化處理。由于目標在整個紅外圖像中的位置、大小不同,因此會影響識別效果,需要通過校準、定位等方法對目標圖像進行矯正。本文將待識別目標的區域放大并將圖像校準為像素為64×64,使得目標特征更為明顯;第2步進行灰度歸一化處理,由于不同圖像受環境影響較大,需要對不同光照條件、光線方向下得到的圖像進行補償,以減弱不同環境條件下拍攝的圖像信號變化,方便后續特征向量的提取。

其中,f(x′,y′)為圖像函數,當(x′,y′)屬于目標區時f(x′,y′) = 1,當(x′,y′)不屬于目標區時f(x′,y′)= 0;a、b、c、d為跟蹤窗口邊界坐標。
獲得圓點后,以0°~360°向周圍做直線,在該直線上尋找飛機圖像的邊緣點。邊緣點到中心的距離最長線段對應的角度α即為飛機圖像軸線方向。該邊緣點所在位置即機頭位置。同樣,由機頭經中心向機尾搜索目標邊緣點,可找到機尾坐標。將軸線方向沿角度α旋轉可將飛行目標圖像轉為機頭向上的標準圖像。
本文示例了直升飛機、民航客機、戰斗機3種機型圖片幾何重構前后對比圖,如圖3所示。

圖3 紅外圖像預處理對比圖
目標圖像的特征提取是識別過程中關鍵的環節,通過提取特征量來刻畫目標圖像的輪廓特征,為BP神經網絡訓練提供輸入參數。采用Contourlet變換分別提取出低頻特征和高頻能量特征。
低頻特征向量包含了大部分能量信息,能平滑逼近圖像的輪廓信息。該部分分量可以作為BP識別中的基礎特征向量。但是,在實際采集的圖片中不同光線下拍攝的目標圖像包含高頻噪聲,Contourlet變換的低頻分量對光線變換并不敏感。
高頻系數能反映目標各個方向的邊緣、細節等信息,是具有較高識別效率的特征,故本方法選取高頻特征向量作為BP神經網絡訓練的修正向量,利用BP神經網絡的修正思想可以對低頻特征訓練進行修正。圖4為某幅直升飛機紅外圖像進行Contourlet變換提取出的16個方向高頻特征,為分解出來的目標邊緣和輪廓信息在各個方向、各個位置的分布情況。

圖4 某幅目標圖像的高頻特征16個方向分布圖
本文采用紅外飛行數據庫作為樣本集。庫中包含直升機、戰斗機、民航客機不同姿態、不同環境下的紅外圖片,訓練圖片和測試圖片互不重疊。對訓練集目標圖像預處理后進行2層Contourlet分解,提取得到16維特征向量,作為輸入目標集[x1,x2,x3,…,x16],輸出目標集設定為[y1,y2,y3]=[1,0,0]、[0,1,0]、[0,0,1]。[5]
將測試集目標圖像預處理后進行2層Contourlet分解,同樣提取16維高頻特征向量,將其作為測試數據送入訓練好的BP網絡模型進行辨識,并計算仿真結果的誤差值。為了便于觀察和調整,本文采用3層網絡,即1層隱藏層,再通過調節隱藏層結點個數來達到網絡精度和訓練時間的平衡最優化化。[6]識別模型流程圖如圖5所示。

圖5 識別模型流程圖
本文對機動目標庫中不同機型飛行圖像進行圖像預處理、特征提取和BP網絡訓練,并對戰斗機、直升機、民航客機的每種機型隨機選取圖像用于測試。神經網絡采用的中間層的傳遞函數為tan-sigmoid,輸出層傳遞函數為log-sigmoid,訓練采用Levenberg-Marquardt算法,收斂準則為訓練的誤差≤0.001。構建過程包括訓練原始數據歸一化、網絡結構優化和數據反歸一化等幾個過程。考慮到訓練時間,設定迭代次數小于10 000,超過則退出程序。
訓練過程中,訓練函數會根據設定的顯示訓練結果的間隔步數值自動顯示當前訓練結果信息,并給出網絡誤差實時變化曲線。當訓練步數大于訓練設定步數、訓練誤差小于訓練目標誤差、訓練時間超過訓練允許時間或誤差梯度值小于訓練中最小允許梯度值時,訓練都將被終止,并返回訓練后的神經網絡對象。
本文提出了一種基于多尺度分析和神經網絡相結合的圖像目標識別方法,通過2層Contourlet變換得到多維高頻特征向量,充分利用了BP神經網絡并行處理能力強、識別預測準確、穩健性好的優勢,對特征向量進行網絡訓練。網絡測試結果表明,本方法目標識別率高,精確性好,能滿足不同類型空中目標的準確識別要求。同時,該方法對于紅外圖像明暗光照變化、目標姿態變換均具有良好的魯棒性。