施端陽,林強,胡冰,陳嘉勛
(1.空軍預警學院,湖北 武漢 430019;2.中國人民解放軍95174部隊,湖北 武漢 430040;3.中國人民解放軍95980部隊,湖北 襄陽 441022)
雷達作為預警探測的主要裝備,在信息化戰爭中的作用越來越顯著。由于地物、海浪和云雨等物體會散射雷達電磁波,雷達回波信號中包含大量的雜波。雷達信號處理過程對回波信號檢測后,無法完全濾除雜波,仍存在部分剩余雜波[1]。剩余雜波可能會形成虛假航跡,浪費雷達的跟蹤資源[2],也可能會造成數據處理系統飽和,影響雷達的探測性能[3]。因此,抑制剩余雜波具有一定的現實意義。
目前,專家學者對雷達剩余雜波抑制方法的研究取得了一些成果。胡祺勇等[4]提出了利用組網雷達點跡和多普勒速度進行融合鑒別假目標的方法,在保證檢測概率的情況下,進一步濾除剩余雜波,該方法可以將不同體制、不同工作模式的雷達組合成網絡,充分利用各雷達的資源優勢彌補單部雷達信息受限的缺陷,使組網雷達的整體抗干擾性能得到了提升。但不同雷達的空間對準和時間同步難度較大,且各雷達之間的信號傳輸質量要求較高,在實際工作中不易實現。段崇棣等[5]提出一種雜波分類輔助的近海岸模糊雜波抑制方法,通過特征提取構造多視干涉特征協方差矩陣,利用協方差矩陣間的仿射不變黎曼距離實現自動分類,獲取近海岸區域方位模糊位置,從圖像的角度對雜波進行抑制。但是由于常規體制的窄帶雷達無法獲得圖像信息,僅能獲取雷達點跡信息,該方法在合成孔徑雷達上取得了較好的效果,卻不適用于常規的窄帶雷達。隨著人工智能技術的發展與應用,利用機器學習方法挖掘窄帶雷達中目標點跡和雜波點跡的差異化特征,對目標和雜波分類識別,進而實現雜波抑制已經成為可能。林堅鑫等[6]提出了基于AdaBoost的雷達剩余雜波抑制方法,該方法運用自適應提升算法構造決策樹分類器,通過組合多個基學習器的結果對目標和雜波進行分類,解決了決策樹分類能力有限的弊端。但是該方法提取的回波信號特征數量較少,容易造成過擬合,影響學習器的泛化能力。SHANG Shang等[7]提出了一種基于改進灰狼優化算法優化徑向基神經網絡的海雜波抑制方法,引入自適應分工搜索策略,使種群在整個優化過程中兼具大規模搜索和局部搜索的能力,解決了標準灰狼優化算法收斂速度慢、容易陷入局部最優的問題,通過徑向基神經網絡建立海雜波預測模型,對海雜波有較好的預測精度和抑制效果。
本文針對雷達剩余雜波影響雷達性能的問題,設計了BP(back propagation)神經網絡分類器模型,通過學習和訓練,分類器能夠對雷達目標點跡和雜波點跡進行自動分類識別,對識別為雜波的點跡進行濾除。引入遺傳算法(genetic algorithm,GA),對網絡的輸入數據進行優化選擇,減少輸入數據維度,提高建模速度。同時,利用遺傳算法的全局搜索能力對網絡的初始權值和閾值進行優化,避免了BP神經網絡收斂速度慢、易陷入局部極值的問題,提高了分類器模型的識別精度。
由于目標和雜波的特性不同,經過電磁波散射后,雷達接收到的目標信號和雜波信號也不盡相同。為了區分目標點跡和雜波點跡,對屬于同一類的點跡進行分類識別,需要選取能夠反映兩者差異化的特征參數。在雷達回波數據格式中,一般以若干個字節表示一個回波點跡,前部分字節表示信號開始、數據長度和原始位標識等標志位,后部分字節表示時間、距離、方位和特征參數等數據位。不同型號雷達的數據格式可能存在差異,但是反映回波點跡特性的特征參數大同小異。某型空管雷達窄帶工作模式的回波數據格式中包含數十個特征參數。為了使分類器模型在較短時間內獲得較高的點跡識別率,應該選取目標點跡與雜波點跡差異化較大的特征作為輸入數據。本文對雷達回波點跡數據進行處理和分析后,選取了多普勒速度、目標原始幅度、目標背景幅度、濾波標志、恒虛警類型、雜噪比、濾波器組選擇和EP(echo presence)質量等8個特征。這些特征在其他型號雷達的回波數據格式中一般也存在,因此具有一定的普適性和代表性。
多普勒速度反映了物體相對于雷達的徑向速度。一般情況下,雜波相對于雷達的運動速度較慢甚至為0,目標相對于雷達有一定的運動速度,一定程度上可以用多普勒速度來區分目標與雜波。
目標原始幅度為信號處理后回波信號的每個處理單元的原始幅度值。雷達接收機收到的原始回波信號中,目標回波幅度可能低于雜波回波幅度,但經過信號處理后目標回波幅度增強,信噪比和信雜比得到改善。由于采用的信號處理技術和制造工藝的差異,同一工作區域,不同型號雷達的回波幅度值也會有所區別。但信號處理后的目標回波幅度整體上強過雜波回波幅度。通過對該型空管雷達大量的回波信號進行統計分析,發現目標點跡的原始幅度主要集中在82~86 dB,雜波點跡的原始幅度主要集中在81~85 dB。因此,原始幅度大于85 dB的點跡很可能是目標點跡,小于82 dB的點跡很可能是雜波點跡。
目標背景幅度為方位-距離單元經過多次掃描估計的背景強度。在同一工作區域,不同型號雷達信號處理方式有所區別,導致不同雷達的雜波幅度不同。同型號雷達在不同工作區域,由于雜波分布不同,雜波幅度也會變化。一般情況下,目標點跡集中的區域背景強度低于雜波點跡集中的區域。通過對回波信號進行分析,發現目標點跡的背景幅度主要集中在79~81 dB,雜波點跡的背景幅度主要集中在79~86 dB。因此,背景幅度大于81 dB的點跡很可能是雜波點跡。
該型空管雷達信號處理時,按照背景環境的區別,將濾波類型分為清潔區、弱雜波區、中等雜波區和強干擾區4種濾波方式。濾波標志為“0”表示清潔區濾波,“1”表示弱雜波區濾波,“2”表示中等雜波區濾波,“3”表示強干擾區濾波。經過統計,目標點跡和雜波點跡的主要濾波方式均為清潔區濾波和中等雜波區濾波,但目標點跡更側重于清潔區濾波方式,雜波點跡更側重于中等雜波區濾波方式。因此,濾波標志可以在一定程度上區分目標點跡和雜波點跡。
該型空管雷達信號處理時,按照背景環境的區別,選用不同的恒虛警類型。恒虛警類型分為4種:“0”表示噪聲恒虛警,“1”表示單元平均恒虛警,“2”表示平均選大恒虛警,“3”表示有序統計雜波圖恒虛警。通常,在背景幅度起伏小的區域選擇噪聲恒虛警,在弱雜波區選擇單元平均恒虛警,在雜波邊緣區域選用單元平均選大恒虛警。經過統計,目標點跡的恒虛警類型主要是噪聲恒虛警和單元平均恒虛警,雜波點跡的恒虛警類型主要是平均選大恒虛警。
雜噪比為雜波功率與噪聲功率的比值,反映了背景環境的復雜度。一般情況下,目標點跡的背景環境比雜波點跡的背景環境更清潔,目標點跡的雜噪比小于雜波點跡的雜噪比。統計發現,目標點跡的雜噪比主要為0~6 dB,雜波點跡的雜噪比主要分散在4~65 dB的范圍內。因此,雜噪比大于7 dB的點跡很可能是雜波點跡。
該型航管雷達根據不同目標的背景環境,在MTD(moving target detection)濾波器組選擇時,將濾波器組分為4類:“0”表示超強濾波器組,“1”表示強濾波器組,“2”表示中等濾波器組,“3”表示弱濾波器組。通常目標的背景環境更為清潔,因此選擇弱濾波器組的點跡更可能為目標,選擇強濾波器組和超強濾波器組的點跡更可能為雜波。
EP質量由雷達點跡的距離展寬、方位展寬、信噪比和EP數量加權求和得到。經過統計,該型航管雷達的目標點跡EP質量主要為5~9,雜波點跡的EP質量主要為3~8。因此,EP質量小于4的點跡很可能是雜波點跡,大于8的點跡很可能是目標點跡。
BP神經網絡是基于誤差反向傳播算法的多層前饋神經網絡[8]。BP神經網絡由輸入層、隱含層和輸出層組成,其中隱含層數量和各層的節點數可以是一個或者多個,如圖1所示。

圖1 BP神經網絡示意圖Fig.1 Schematic diagram of BP neural network

(1)
網絡的期望輸出為
d(s)=(d1,d2,…,dN).
(2)
2.1.1 輸入信號正向傳播
在BP神經網絡中,數據按照輸入層-隱含層-輸出層的順序,逐層向后傳播。網絡中輸入層的神經元數量為輸入向量的維數,輸入層的輸出為神經網絡的輸入信號。假設輸入信號為x(s),則輸入層第m個神經元的輸出為
(3)
隱含層第i個神經元的輸入為
(4)
假設隱含層傳遞函數為f(·),則隱含層第i個神經元的輸出為
(5)
輸出層第n個神經元的輸入為
(6)
假設輸出層傳遞函數為g(·),則輸出層第n個神經元的輸出為
(7)
輸出層第n個神經元的誤差為
(8)
神經網絡的總誤差為
(9)
2.1.2 誤差信號反向傳播
當神經網絡誤差大于設定值時,需要調整各神經元之間的連接權值。在對權值進行調整時,沿著誤差減小的方向,按照反向順序,逐層向前修正權值。隱含層與輸出層之間的權值調整為
ωin(s+1)=ωin(s)+Δωin(s),
(10)
輸入層與隱含層之間的權值調整為
ωmi(s+1)=ωmi(s)+Δωmi(s),
(11)
式中:Δωin(s),Δωmi(s)分別為隱含層與輸出層之間和輸入層與隱含層之間的權值調整量,其大小取決于訓練算法。
經過多次學習訓練,當誤差縮小至設定的范圍時神經網絡訓練完成,此時可以利用訓練好的神經網絡分類器模型對未知屬性的雷達點跡進行分類識別,對識別為目標的雷達點跡予以保留,識別為雜波的雷達點跡進行濾除,以達到雜波抑制的目的。
BP神經網絡分類器的設計需要確定網絡層數、輸入層節點數、隱含層節點數、輸出層節點數、傳遞函數、訓練方法和訓練參數設置等內容[9]。理論證明,單個隱含層結構的BP神經網絡可以實現任意的非線性映射[10]。因此,本文設計的BP神經網絡層數為3層。由于輸入層節點數和輸出層節點數分別取決于輸入和輸出數據的維度,本文選取的雷達點跡數據特征有8個,網絡的輸出為一維,“1”表示目標,“0”表示雜波,因此輸入層節點數為8個,輸出層節點數為1個。隱含層節點數公式[11]為
(12)
式中:M和N分別為輸入層和輸出層節點數;a為[0,10]之間的常數。經過驗證,a取值為10時雷達點跡的識別效果最好。
由式(12)可知,輸出層節點數為13個。BP神經網絡的傳遞函數必須可微,本文隱含層選用tansig函數,輸出層選用purelin函數。訓練算法為帶有動量項的梯度下降法,最大迭代次數1 000次,目標誤差0.1,學習率0.1。
BP神經網絡學習規則簡單,非線性擬合能力強,易于實現。但該算法收斂速度較慢,對初始權重較為敏感,全局搜索能力較差,易陷入局部極值[12]。遺傳算法是一種隨機搜索算法,適用于高度非線性的無解析表達式的目標函數的優化[13]。遺傳算法通過選擇、交叉和變異操作,從初始種群中篩選更適應環境的個體,使種群進化到搜索空間中更好的區域,不斷進化迭代,最后得到最適應環境的個體,求得問題的最優解[14]。遺傳算法優化BP神經網絡分為2個部分:一是利用遺傳算法篩選BP神經網絡分類器模型的輸入特征數據,剔除冗余的特征,降低數據維度,縮短建模時間;二是在篩選過程中計算適應度函數時,利用遺傳算法優化網絡的權值和閾值,避免網絡陷入局部極值,提高識別精度。GA優化BP神經網絡的流程如圖2所示。

圖2 GA優化BP神經網絡流程圖Fig.2 Flow chart of BP neural network optimized by GA
在BP神經網絡雷達點跡分類器模型中,選取了雷達回波數據中的8個特征作為輸入自變量,雷達點跡的類型作為輸出因變量。8個特征中可能包含冗余的自變量或并非相互獨立的自變量,若全部作為輸入數據,會增加神經網絡分類器模型的計算量,延長建模時間。利用遺傳算法對輸入自變量進行優化選擇,篩選出最能反映輸入與輸出關系的自變量參與建模,以實現輸入自變量降維的目的。
3.1.1 個體編碼與初始種群產生
利用遺傳算法優化時,需將解空間映射到編碼空間。BP神經網絡雷達點跡分類器模型中,輸入自變量為8個,個體的一位編碼對應一個輸入自變量,因此編碼長度設為8。采用二進制編碼方式[15],編碼的基因取值為“1”表示選擇該自變量,為“0”表示不選擇該自變量。隨機產生p個8位編碼的初始串結構數據,構成一個初始種群。遺傳算法以這p個個體作為初始點開始迭代。
3.1.2 適應度函數計算
適應度函數用來衡量各個個體接近最優解的優劣程度。適應度函數值越高的個體遺傳到下一代的概率越大。本文選用樣本數據集誤差平方和的倒數作為適應度函數,即
(13)

3.1.3 選擇操作
選擇操作采用比例選擇算子,父代個體遺傳到子代種群中的概率與該個體適應度函數值成正比,步驟如下:
Step 1: 計算種群的總體適應度值。
(14)
Step 2: 計算個體的相對適應度值,即該個體被遺傳到子代種群的概率。
(15)
Step 3: 采用輪盤賭法[16]。由式(15)可知某個個體的累計概率為
(16)
選擇時每輪產生一個(0,1)之間的隨機數γ,若qr-1<γ 3.1.4 交叉操作 交叉操作選用單點交叉算子,其原理如圖3所示,步驟如下: Step 1: 對種群中的個體兩兩隨機配對,本文初始種群大小為20,有10對配對的個體。 Step 2: 對每一對配對的個體隨機生成一個交叉點。 Step 3: 對每一對配對的個體,按Step 2中確定的交叉點互換2個個體的部分染色體,產生2個新個體。 圖3 遺傳算法交叉操作示意圖Fig.3 Cross operation diagram of genetic algorithm 3.1.5 變異操作 變異操作選用單點變異算子,隨機產生變異點后改變其對應基因座上的基因值,其原理如圖4所示。 圖4 遺傳算法變異操作示意圖Fig.4 Mutation operation diagram of genetic algorithm 在對BP神經網絡雷達點跡分類器模型的輸入自變量降維時,需要建立BP神經網絡并以其輸出值的誤差平方和的倒數作為適應度函數。為了避免初始權值和閾值的隨機性對適應度函數值的影響,對每一個個體的適應度進行計算時,都引入遺傳算法對所建立的BP神經網絡初始權值和閾值進行優化。 3.2.1 個體編碼與初始種群產生 雷達點跡分類器模型中,BP神經網絡的結構為8-13-1,權值數量為8×13+13×1=117個,閾值數量為13+1=14個,所以個體的編碼長度設為117+14=131個。隨機產生20個初始種群,種群編碼選用實數編碼。 3.2.2 適應度函數計算 種群中各個個體都有對應的初始權值和閾值,將個體的網絡輸出與期望輸出誤差平方和的倒數作為個體適應度值,同式(13)。 3.2.3 選擇操作 選擇操作采用比例選擇算子,隨機搜索方法采用輪盤賭法,個體適應度值越高,被選擇的概率越大,具體步驟同3.1.3。 3.2.4 交叉操作 交叉操作選用算術交叉算子,以給定的概率,隨機選擇一對個體進行交叉操作,產生新個體,步驟如下: Step 1: 對種群中的個體兩兩隨機配對。 Step 2: 對每一對配對的個體,以式(17)進行交叉產生一對新的個體。 (17) 式中:a1,a2為一對配對的個體;b為交叉概率,取0~1之間的隨機數;c1,c2為一對交叉后的新個體。 3.2.5 變異操作 變異操作選用非均勻變異算子,以給定的概率隨機選擇個體進行變異操作。如選中個體ai在第j個基因座變異后得到新基因aij。 (18) h(g)=r(1-g/Gmax)2, (19) 式中:amax,amin分別為基因aij的上下界;r為0~1之間的隨機數;g為當前迭代次數;Gmax為最大迭代次數。 遺傳算法的參數選擇對性能影響較大,參數涉及到群體規模、編碼長度、交叉概率、變異概率等。群體規模影響算法的計算效率和收斂性,群體規模過小會導致收斂到局部最優,過大會降低計算速度,一般在10~200之間選擇。經過不同群體規模值的對比分析,文中群體規模設為20時分類效果較好;編碼長度與輸入神經網絡的特征數量和網絡結構有關。文中在自變量降維時由于選取的點跡數據特征參數有8個,因此編碼長度為8,優化閾值和權值時神經網絡的結構為8-13-1,權值數量為8×13+13×1=117個,閾值數量為13+1=14個,所以個體的編碼長度設為131。交叉概率決定了交叉操作被使用的頻率,交叉概率過大可使各代充分交叉,但會破壞群體中優良的模式,產生較大的代溝,導致算法偏向隨機搜索;交叉概率過小會導致進化速度降低,搜索可能會停滯,一般取值范圍為0.4~0.99。經過不同交叉概率值的對比分析,文中交叉概率設為0.6時分類效果較好。變異概率決定了群體的多樣性,過大的變異概率增加了群體的多樣性,但也可能會破壞群體中好的模式;過小的變異概率會使群體的穩定性增加,無法抑制早熟現象,一般取值范圍為0.001~0.1。經過不同變異概率值的對比分析,文中變異概率設為0.05時分類效果較好。 采集某型空管雷達窄帶工作模式的30 000個點跡數據,隨機選取24 000個點跡作為訓練數據集,其余點跡作為測試數據集。數據集中目標點跡和雜波點跡各占50%,訓練數據集中雷達目標點跡標簽設為“1”,雜波點跡標簽設為“0”,測試數據集中雷達點跡不含標簽。數據劃分如表1所示。 表1 數據分布表Table 1 Data distribution table 首先,利用訓練數據集對設計的BP神經網絡雷達點跡分類器模型進行訓練,得到訓練好的模型;然后,將不帶標簽的測試數據集輸入分類器模型中進行識別分類,將分類結果與測試數據集中雷達點跡的真實類別進行對比統計,得出點跡識別率。同時,保留識別為目標的點跡,濾除識別為雜波的點跡。 根據3.1節介紹的遺傳算法自變量降維步驟對BP神經網絡雷達點跡分類器模型的8個輸入特征進行優化篩選。染色體長度為8,種群大小設置為20,最大進化代數設置為100次。篩選時為了避免初始權值和閾值的隨機性對測試結果的影響,利用遺傳算法對降維用到的BP神經網絡的初始權值和閾值進行優化。得到最優的二進制編碼為(11111101),即優化篩選后的輸入自變量編號為1,2,3,4,5,6,8。篩選后的輸入特征為多普勒速度、目標原始幅度、目標背景幅度、濾波標志、恒虛警類型、雜噪比和EP質量,剔除了“濾波器組選擇”特征。 通過對選取的24 000個作為訓練數據集的點跡進行分析得知,被選點跡均處于雷達清潔區,由于清潔區的背景環境比較簡潔,在MTD濾波器組選擇時,均采用了弱濾波器組,即輸入數據中第7個特征參數均為“3”。因此,輸入數據無法根據“濾波器組選擇”特征來區分目標點跡和雜波點跡,與本文的輸入自變量篩選結果相符。 遺傳算法自變量降維過程如圖5所示。當種群進化到第20代時種群的平均適應度函數值趨于穩定,得到最優個體。 圖5 種群適應度函數進化曲線Fig.5 Evolution curve of population fitness function 為了檢驗遺傳算法對BP神經網絡雷達點跡分類器模型的優化效果,分別建立基于BP神經網絡和遺傳算法優化的BP神經網絡雷達點跡分類器模型。利用表1中的數據,輸入訓練數據集24 000個點跡的全部8個特征對神經網絡分類器模型進行訓練,訓練時采用traingdm訓練算法,訓練完成后對6 000個測試數據集點跡進行識別。 圖6為測試數據集6 000個點跡的真實類別分布圖,圖中橫坐標為方位,縱坐標為距離,綠色點表示目標點跡,紅色點表示雜波點跡。由圖6可知,測試數據集中包含大量的雜波。 圖6 測試樣本空間分布圖Fig.6 Spatial distribution of test samples 圖7為優化前后的BP神經網絡雷達點跡分類器模型的識別效果,圖中藍色點表示將測試數據集中真實的目標點跡錯誤識別為雜波的點跡,黑色點跡表示將真實的雜波點跡錯誤識別為目標的點跡。通過圖7a)和圖7b)的對比可以看出,后者的黑色點少于前者,說明優化后BP神經網絡分類器模型對雷達雜波的識別率高于優化前。 圖7 GA優化前后BP神經網絡識別效果對比Fig.7 Comparison of BP neural network recognition effect before and after GA optimization 對雷達點跡分類識別后,濾除被分類器模型識別為雜波的點跡,保留被識別為目標的點跡,得到雜波抑制后的效果。遺傳算法優化前后的雜波抑制效果如圖8所示。通過圖6和圖8的對比可知,優化前后的2種雜波抑制方法均保留了絕大部分的目標點跡,濾除了絕大部分的雜波點跡,實現了雜波抑制的目的。由圖8a)和圖8b)的對比可知,后者的紅色點更少,即濾除了更多的雜波,尤其是黑框部分的對比較為明顯,說明遺傳算法優化后的BP神經網絡雷達點跡分類器模型的雜波抑制效果更好。 圖8 GA優化前后BP神經網絡雜波抑制效果對比Fig.8 Comparison of clutter suppression effect of BP neural network before and after GA optimization 將分類器模型識別后的點跡類別與測試數據集中點跡的真實類別對比得出,優化前后的識別率如表2所示。遺傳算法優化后的BP神經網絡雷達點跡分類器模型相比優化前,對雜波的識別率提高了1.5%,識別時間縮短了20.4%,優化后能夠更快更準確地抑制剩余雜波。此外,與文獻[17]中k近鄰算法雷達點跡分類器模型的雜波點跡抑制率接近70%相比,遺傳算法優化后的BP神經網絡算法比k近鄰算法的雜波抑制效果至少高出14.2%。說明本文所提算法的雜波抑制效果更好。 表2 遺傳算法優化前后的識別率Table 2 Recognition rate before and after GA optimization 本文提出了遺傳算法優化BP神經網絡的雷達雜波抑制方法。通過雷達實測數據測試表明,該方法縮短了識別時間,提升了識別精度,達到了更好的雜波抑制效果。

3.2 遺傳算法優化BP神經網絡權值和閾值
4 測試結果與分析

4.1 遺傳算法自變量降維

4.2 雷達雜波抑制效果




5 結束語