陳曉斯,程正東,樊 祥,朱 斌,丁 磊
(1.電子工程學院脈沖功率激光技術(shù)國家重點實驗室,安徽合肥230037;2.中國電子科技集團公司第十六所信息檔案部,安徽合肥230037)
城市錯綜復雜的輻射環(huán)境,包括大氣塵埃、氣溶膠以及城市中建筑、樹木邊緣和飛鳥等帶來的非線性信號往往影響著紅外搜索跟蹤系統(tǒng)(IRST)的作戰(zhàn)性能,易導致其虛警率較高。
目前,針對IRST系統(tǒng)的研究主要集中在紅外小目標的檢測算法[1]。濾波是紅外小目標檢測的常用方法[2],代表方法包括最大中值濾波[3]、高通濾波[4]、形態(tài)學濾波[5]等,這類方法處理非線性問題效果不佳;另一種是基于分類思想,代表方法包括PCA[6]、SVM[7]。這類方法在建立數(shù)據(jù)庫和訓練過程上花費的時間過多。
將 k-最近鄰(k-Nearest Neighbor,k-NN)思想用于單幀預測,可視為濾波與分類思想的結(jié)合,其預測前無需對樣本數(shù)據(jù)進行訓練,引入了最近鄰判別決策,通過對預測窗口進行分類計算得到預測結(jié)果。但在實驗過程中遇到了兩個問題。一是若所選預測點的個數(shù)遠大于實際近鄰數(shù),則所預測的數(shù)值將與實際值相差甚遠,偏倚過高。二是城市環(huán)境下所拍攝的紅外圖像表現(xiàn)出明顯的非線性、非平穩(wěn)分布特征使得算法的性能不理想。
本文首先對k-NN算法進行距離加權(quán)改進,然后引入核方法,提出了一種基于核距離加權(quán)的k-最近鄰紅外小目標檢測算法,實驗表明,該算法有很好的濾波性能,適用于低信噪比情況下的小目標檢測。
傳統(tǒng)的k-最近鄰法的基本定義[8]為:使用訓練集Γ在輸入空間中最鄰近x的觀測值形成f^(x),表示為:其中,k表示最近鄰個數(shù);xi表示k個近鄰中第i個近鄰。因此,k-最近鄰背景濾波器可以表示為:


式中,N(x0)是x0的鄰域,f^(m,n)為(m,n)點的預測背景灰度值;x(m-s,n-t)為原始圖像預測窗口內(nèi)與中心點灰度值鄰近的像素灰度值;w為權(quán)值大小,為1/k,相當于對和求平均;s,t表示預測窗內(nèi)的像素坐標;Ns,Nt為預測窗口的范圍。3 基于核距離加權(quán)的k-最近鄰濾波器3.1 k-最近鄰算法的距離加權(quán)改進
對k-最近鄰算法進行改進,即對k個近鄰的貢獻加權(quán)。根據(jù)它們相對目標點x0的距離,將較大的權(quán)值賦給較近的近鄰。式(1)改寫為:

其中,xi表示查詢點x附近的第i個數(shù)值。求和的目的是為了將不同權(quán)值的貢獻歸一化。為了得到可接受的權(quán)值,首先從隨機的權(quán)值開始,需要指定一個度量標準來衡量假設相對于訓練樣例的訓練誤差(training error)。本文使用一種常用的度量標準:

其中,D是訓練樣例集合;f(x)是訓練樣例的目標輸出;^f(xi)是第i個近鄰參與貢獻后的輸出。然后反復地應用這個感知器到每一個訓練樣例上,然后每一步根據(jù)感知器訓練法則來修正權(quán)值,即根據(jù)誤差不斷修改與輸入xi對應的權(quán)值wi,表示如下:

其中:

其中,η是一個正的常數(shù),稱為學習速率(learning rate),其決定梯度搜索的步長。
在有限次地使用訓練法則后,上述訓練過程會收斂到一個能正確分類所有訓練樣例的權(quán)向量,若數(shù)據(jù)不是線性可分,那么不能保證訓練過程收斂。為了解決樣例非線性可分時的情況,使用梯度下降來搜索可能的權(quán)向量的假設空間,以找到最佳擬合訓練樣例的權(quán)向量,其輸出表示如下:

梯度下降搜索從一個任意的初始權(quán)向量開始,以很小的步伐繁復修改這個向量。每一步都沿著誤差最陡峭的方向修改,繼續(xù)這個過程直到得到全局的最小誤差點。從式(4)中計算E的微分,從而得到這個梯度向量的分量,過程如下:


為了充分考慮復雜背景所帶來的非線性影響,將k-最近鄰算法作為核方法的載體函數(shù),對距離加權(quán)wi進行了核變換,即將核函數(shù)作為一個距離函數(shù),用它來決定每個訓練樣例的權(quán)值,表示為:

為了修改這個過程用于推導出局部逼近,下面根據(jù)不同的情況重新定義了誤差準則E,用來著重于擬合局部訓練樣例。
(1)若考慮只對在k個最近鄰上的誤差平方最小化,式(4)表示為:

其中,xi表示訓練樣例i的一個輸入分量。把式(8)代入式(6)便得到梯度下降權(quán)值更新法則:
(2)若考慮使整個訓練樣例集合D上的誤差平方最小化,但對每個訓練樣例加權(quán),權(quán)值為關(guān)于相距x距離的遞減核函數(shù)κ(x,xi),式(4)表示為:

結(jié)合式(10)和式(11),可以得到:

因此,式(9)可以重新表示為:

式(13)和式(9)給出的法則之間的差異為:實例x對權(quán)值更新的貢獻如今乘上了一個距離懲罰項κ(x,xi),并且僅對k個最近鄰的訓練實例的誤差求和。目前常用的核函數(shù)如表1所示。

表1 幾種常用的核函數(shù)Tab.1 the several kernel functions used commonly
④計算權(quán)值訓練梯度Δwi;
⑤更新權(quán)值并保存wi←wi+Δwi,i=i+1;
⑥若i≠k,重復步驟③~⑤;若i=k,將保存的 w1,w2,…,wk代入式(3),得到最后預測值。
遍歷整幅圖像,獲得預測圖像,而后進行目標提取檢測,檢測流程如圖1所示。

圖1 檢測流程圖Fig.1 Experimental flowchart
對于每一個預測窗口內(nèi)的目標點,算法的權(quán)值更新步驟流程為:
①初始化權(quán)值w0,學習速率η,i=1;
②尋找目標點的k個近鄰點;
③計算初始預測值f^(xi),訓練誤差E(wi);
實驗中選取20組以城市環(huán)境為背景拍攝(拍攝儀器:Thermal CAM PM595-1)的紅外圖像進行小目標提取,圖像大小為320×240像素。實驗條件:計算機主板為 CPU 2.33GHz,內(nèi)存2GB。
為了檢測算法性能的好壞,選取常用的三個標準進行評價:信噪比增益(GSNR),背景抑制因子(BSF)以及單幀運算時間(TPF/s),具體定義為:GSNR=SNRo/SNRi,SNR=S/N,其中 S 是目標區(qū)域灰度最大值,N是背景灰度均值;BSF=σin/σout,其中σin是原始圖像的背景均方差,σout濾波殘差圖像的背景均方差。GSNR越大,表示算法提高圖像信噪比的能力越強[9]。BSF是衡量算法背景抑制能力的重要參數(shù),越大代表背景抑制能力越強。TPF越小說明算法運算效率越高。
參數(shù)設置為:預測窗口均使用5×5的矩形窗口;最近鄰個數(shù)k=7;學習速率η=1;高斯核函數(shù)中不同σ的取值平均結(jié)果如表2所示,當σ≥50時,GSNR、BSF和 TPF趨于穩(wěn)定,因此本文取σ=50。

表2 不同高斯核參數(shù)的實驗平均結(jié)果Tab.2 the experimentalmean results of different Gauss kernel parameters
為了進一步驗證算法性能,選取最大中值濾波(M-Med)、數(shù)學形態(tài)學濾波(Morphology)、k-最近鄰濾波(k-NN)和基于核距離加權(quán)的k-最近鄰(K k-NN)濾波四種算法進行實驗效果對比。將四種算法的GSNR、BSF和TPF實驗數(shù)據(jù)繪制成曲線,如圖2所示。從圖中可以看出,引入核方法后的k-最近鄰算法即K k-NN算法的性能在GSNR和BSF上均有十分顯著的提升,原因是核函數(shù)將數(shù)據(jù)從原始數(shù)據(jù)映射到高維空間中進行了分類,從而精確地確定了權(quán)值更新的步長,這一優(yōu)點也使得算法在耗時上高于其余三種算法,不過仍可以滿足實時性的要求。相比而言,k-NN算法、M-Med算法和Morphology算法雖然運算時間低于K k-NN算法,但GSNR和BSF都偏低。

圖2 四種算法的GSNR、BSF和TPF曲線圖Fig.2 Metric comparison of different detection methods
選取了三幅帶有城市背景的紅外圖像,圖3給出了四種算法的實驗濾波結(jié)果,可以清楚地看到,M-Med算法和Morphology算法的濾波圖像中的背景泄露十分嚴重,特別是背景邊緣部分,如圖3(d)、圖3(e)所示;k-NN算法背景抑制效果較好,但濾波圖像中目標幾乎淹沒在背景之中,這將影響后續(xù)的目標提取,如圖3(f)所示;而K k-NN算法在較好抑制背景邊緣的同時,仍能凸顯目標信息,效果較好。

圖3 四種算法的城市背景紅外圖像實驗結(jié)果(a)原始圖像;(b)K k-NN預測圖像;(c)K k-NN濾波圖像;(d)M-Med濾波圖像;(e)Morphology濾波圖像;(f)k-NN濾波圖像Fig.3 Experimental results of K k-NN,k-NN,M -Med and Morphology algorithms(a)Original image;(b)K k-NN estimate background;(c)K k-NN filter result;(d)M-Med filter result;(e)Morphology filter result;(f)k-NN filter result
提出了一種基于核距離加權(quán)的k-最近鄰(K k-NN)紅外小目標檢測算法,該算法通過引入最近鄰判別決策,按距離大小進行加權(quán)改進,并結(jié)合核方法,得到了理想的預測圖像。實驗表明,該算法上在單幀檢測算法中表現(xiàn)了較好的濾波性能。下一步,可通過引入稀疏以及核函數(shù)的優(yōu)化來提高算法實時性。
[1] GUOWei,ZHAO Yigong,XIE Zhenhua,et al,New method for cloud description and dim small infrared target detection based on nonparametric statistics[J].J.Infrared Millim.Waves,2008,27(5):383 -387.(in Chinese)郭偉,趙亦工,謝振華,等.基于非參數(shù)統(tǒng)計的云層背景描述與紅外弱小目標檢測[J].紅外與毫米波學報,2008,27(5):383 -387.[2] ZHAO Jiajia,TANG Zhengyuan,YANG Jie,et al.Infrared small target detection based on image sparse representation[J].J.Infrared Millim.Waves,2011,30(2):156 -161.(in Chinese)趙佳佳,唐崢遠,楊杰,等.基于圖像稀疏表示的紅外小目標檢測算法[J].紅外與毫米波學報,2011,30(2):156-161.
[3] SD Deshpande,M H Er,R Venkateswarlu,and P Chan,Max-mean and max-median filters for detection of small targets[J].SPIE Signal and Data Processing of Small Targets,1999,3809:74 -83.
[4] L Yang,JYang,K Yang,Adaptive detection for infrared small target under sea - sky complex Background[J].E-lectron.Lett.,2004,40(17):1083 -1085.
[5] GUO Runqiu,ZHANG Ying,LIN Xiaochun.A new method of infrared dim small targets detection by morphology filtering[J].Laser & Infrared,2005,35(6):451 - 453.(in Chinese)過潤秋,張穎,林曉春.基于形態(tài)學的紅外小目標檢測算法[J].激光與紅外,2005,35(6):451 -453.
[6] HU Tun,ZHAO Jiajia,CAO Yuan,et al.Infrared small target detection based on saliency and principle component analysis[J].J.Infrared Millim.Waves,2010,29(4):303 -306.(in Chinese)胡暾,趙佳佳,曹原,等.基于顯著性及主成分分析的紅外小目標檢測[J].紅外與毫米波學報,2010,29(4):303-306.
[7] GUO Zhangting,XIN Yunhong.Small IR target detection algorithm based on classified background prediction and image blocking[J].Laser & Infrared,2012,42(5):573 -578.(in Chinese)郭張婷,辛云宏.紅外小目標的分類背景預測與圖像分塊技術(shù)[J].激光與紅外,2012,42(5):573 -578.
[8] Trevor Hastie,Robert Tibshirani,Jerome Friedman.The elements of statistical learning datamining,inference,and prediction[M].Beijing:Publishing House of Electronics Industy,2007.
[9] Alexander Tartakovsky,Rudolf Blazek.Effective adaptive spatial-temporal technique for clutter rejection in IRST[C].Proc.of SPIE,2000,4048:85-95.