林 斌,范永弘
(信息工程大學 測繪學院,河南 鄭州 450052)
對于理想的紅外焦平面陣列,有相同的入射輻射就該有一致的響應輸出。但是在實際過程中由于材料質量和制作工藝等因素的影響,每個探測器在阻抗、容抗、熱敏面積、電阻溫度等方面都存在微小差別,使得實際響應輸出并不一致,這就是IRFPA響應的非均勻性[1]。非均勻性的直接結果就是使紅外圖像產生不同程度的噪聲,影響成像質量,這種情況下就要對紅外焦平面陣列進行非均勻校正[2]。紅外圖像的非均勻性校正方法很多,但是總的來講分為兩大類:第一類是基于定標技術的,第二類是基于場景技術的[3]。基于定標技術的算法主要應用于噪聲不變的非均勻校正中,但是在實際過程中卻不能避免噪聲漂移帶來的問題,因此需要一種能夠解決這一問題的算法,即基于場景技術的非均勻校正算法。
傳統神經網絡校正法是基于場景技術的非均勻校正方法,由于它是一個反饋模型,根據誤差調整閾值和權值,所以在理論上它完全不需要對IFPRA進行定標,對探測器參數的線性和穩定性要求也不高,但是其存在收斂速度慢[4]、校正精度低、邊緣模糊和迭代步長不易選擇等缺點。基于這些問題,文獻[5]提出了利用BP神經網絡進行非均勻校正,而且選用不同的步長達到快速收斂的效果。此算法效果良好,但是圖像容易出現邊緣模糊。本文在其基礎上進行改進,提出基于中值濾波和添加動量項的BP神經網絡非均勻校正算法。結果表明,改進的算法可以有效保留圖像邊緣細節。
人工神經網絡是在精神病學家和神經解剖學家McCulloch與數學家Pitts于1943年提出的神經元生物學模型基礎上發展起來的模擬人腦信息處理的人工智能技術[6]。人工神經網絡集合了大量簡單神經元,并將其進行互聯組成一個復雜網絡,因此,它是一種典型的多元輸入、單元輸出模型。其數學模型為

式中:w為輸入值與神經元連接的權值,x為網絡的輸入值,b為閾值,u為神經元的凈輸入值,z為調整后的值,同時稱為神經元的局部感應區,f(.)為激勵函數。
BP神經網絡是一種多層次前饋神經網絡,該網絡的主要特點是信號前向傳遞,誤差反向傳遞。在前者傳遞中,輸入信號從輸入層經隱含層逐層處理,直至輸出層,每一層的神經元狀態值影響下一層神經元狀態。如果輸出層得不到期望輸出,則轉向反向傳播,根據預測誤差調整網絡權值和閾值,從而使BP神經網絡預測輸出不斷逼近期望輸出。BP神經網絡的拓撲結構如圖1所示。

圖1 BP神經網絡
根據圖1,在某種程度上可以把BP神經網絡比作一個非線性函數,該函數的自變量和因變量即是網絡的輸入值和預測值。利用非線性可微分函數進行權值訓練,具有自適應、自學習能力,在自動控制、飛行軌道模擬、噪聲抑制、模式識別等眾多領域得到了廣泛的應用。
[5]可以得到BP神經網絡算法進行焦平面陣列非均勻性的具體實現形式。此算法包含輸入層、隱含層和輸出層三層網絡結構,其中有5個輸入、3個隱含層輸入、1個輸出。網絡輸入值是探測元D(i,j)及其相鄰上下左右探測元第n幀的圖像輸出,用X(n)表示。輸入層X和隱含層yi之間的權值矩陣及其閾值用Wi(n),bi(n)表示,隱含層和輸出層之間的權值矩陣和閾值用Vn,bn表示。隱含層的激勵函數為

輸出層的激勵函數是f2(x)=x。

圖2 BP神經網絡非均勻校正網絡結構
探測元(i,j)第n幀的期望輸出為其相鄰4個探測元的平均值,誤差函數分別為

控制量根據梯度修正法修正權值和閾值,使得不斷接近期望值。

式中lr為學習速率。通過反復迭代,最終得出逼近的期望值。
在較弱的空間噪聲下,神經網絡算法具有較好的校正效果;但是在較強的空間噪聲下,該算法的校正效果較差。因此控制強噪聲是發揮神經網絡校正算法性能好壞的直接因素之一。由于中值濾波器在消除椒鹽噪聲和保護圖像細節方面具有良好的效果,所以本文采用了中值濾波器對紅外圖像的噪聲進行預處理。中值濾波器的表達式為

該中值濾波器實現了將像元D(i,j)及其四鄰域的輸出值進行中值處理,最后將處理后的輸出值H(i,j)作為D(i,j)的值。
對文獻[5]提出的BP神經網絡算法進行改進,主要在以下兩方面:
1)對中值濾波后的圖像灰度值進行歸一化處理。
2)采用增加動量項的方法提高學習效率,防止陷入局部最優產生邊緣模糊。
數據歸一化是指神經網絡在進行結果預測前對輸入數據的一種處理方法,其目的就是將輸入數據都轉換到[-1,1],這樣可以避免各維數間因數量級差別而造成網絡預測誤差增大的情況發生。
上節中神經網絡權值迭代采用梯度學習算法,網絡權值修正較慢且容易陷入局部最優,故本文采用了通過增加動量項的方法提高網絡學習效率。增加動量項的權值和閾值學習公式為

式中:lr1,lr2為學習速率。通過式(8)~式(11)對權值和閾值進行迭代,可以改善局部最優。
本文選用128*128的模擬紅外焦平面陣列響應圖像作為實驗仿真圖,并采用matlab進行算法的仿真。圖3(a)表示紅外焦平面理論輸出圖像,圖3(b)表示噪聲強度很大的圖像。

圖3 焦平面理想圖像和含有非均勻性的圖像
首先對圖像采用中值濾波器進行預處理,然后利用matlab進行BP神經網絡非均勻校正實驗仿真。該BP神經網絡采用5個輸入、3個隱含層和1個輸出的模型。圖4表示實驗結果,其中圖4(a)表示采用上述中值濾波器進行中值濾波的的實驗圖;圖4(b)表示在圖4(a)的基礎上進行BP神經網絡運算的實驗結果(epoch=200)。最后隨機選取一個探測元D(i,j),將其輸出以及相鄰的上下左右4個探測元的輸出作為BP神經網絡的輸入,在原來和改進算法上進行實驗驗證,并選用不同的學習速率分別進行仿真。圖5和圖6分別表示在不同的學習速率下未添加動量項時的誤差曲線和添加動量后的誤差曲線。

圖4 實驗仿真結果
從實驗結果看,經過中值濾波器進行中值濾波預處理后,圖像(圖4(a))已明顯去除了大量噪聲,再采用添加動量項的BP神經網絡進行圖像的非均勻校正,圖像在第200幀的結果如圖4(b)所示。從實驗結果看,圖像在預處理后的基礎上非均勻性校正效果明顯,而且圖像的邊緣細節保留較好。從圖5和圖6的誤差曲線走勢看,當采用較大的學習速率時(Lr1=0.5,Lr2=0.5),網絡的收斂速度快(見圖6)。當設定期望輸出與隨機選取探測元輸出值的均方誤差為1%時,未添加動量項的BP神經網絡方法比添加動量項的速度提高一倍。同樣設定均方誤差為1%,當采用較小的學習速率時,發現兩者的收斂速度都變慢,尤其以添加動量項的更為顯著。

根據以上的實驗分析可知,對于本文提出的添加動量項的BP神經網絡算法,在非均勻性很大的情況下,可以先采用中值濾波器進行圖像預處理,這樣可以去除一些椒鹽噪聲而且能夠保留一些圖形細節,然后可以根據圖像的邊緣細節情況選用是否添加動量項。若圖像邊緣細節豐富,則選用添加動量項的BP神經網絡,并選用較小的學習速率,雖然耗費的時間長一點,但這樣可以保證圖像較好的保留邊緣細節;相反,則選取未添加動量項的BP神經網絡方法。
參考文獻:
[1]常本康,蔡毅.紅外成像陣列與系統[M].修訂版.北京:科學出版社,2006:229.
[2]吳傳璽,代少升.基于中值濾波的紅外焦平面陣列非均勻性神經網絡校正[J].紅外,2010,31(8):14-18.
[3]Xing Su-xia,Zhang Jun-Jv,et al.Two-point Nonuniformity Correction based on LMS[J].SPIE,2005,5640:130-136.
[4]張科,趙桂芳,崔瑞青,等.神經網絡非均勻性校正算法中初始權值選取方法[J].激光與紅外,2007,37(3):248-251.
[5]朱杰,麻芃,宋利權,等.焦平面陣列BP神經網絡非均勻性校正及其算法改進[J].紅外技術,2010,32(7):377-380.
[6]Scribner D A,Sarkady K A,Gaulfield J T,et al.Nonuniformity correction for stating IR focal plane arrays using scene-based techniques[C]//Proceddings of SPIE,Infrared Detectors and Focal Plane Arrays,1990,1308:224-233.
[7]樓波,張峰,宋利權,等.改進的神經網絡非均勻性校正方法[J].紅外與激光工程,2008,37(2):300-303.