翁永祥,趙萬磊,鄭志娟
(中國電子科技集團公司第五十一研究所,上海201802)
雷達信號分選是指對偵察接收機截獲到的密集信號流進行解耦合,形成脈沖描述字(PDW),并從中提取信息將PDW映射到不同輻射源。信號分選是后續電子對抗決策的基礎,也是當前電子偵察系統中信號處理的核心部分[12]。隨著新體制雷達技術的發展,其采取的復雜波形、參數捷變等技術導致當前戰場電磁環境愈加復雜,已有文獻顯示,相對于20世紀70年代,當前電磁環境的信號流密度和信號波形種類都已呈現指數級的增長[3],在這種情況下,傳統的基于直方圖的信號分選算法已不能適應當前作戰需求。
聚類分析作為統計學習理論中一種常用的非監督數據挖掘方法,具備計算簡單、收斂速度快、易于實現等優點,逐漸被應用于復雜電磁環境下的信號分選,并取得了一定的成果。文獻[4]針對噪聲背景下的雷達信號分選問題,提出一種基于自組織特征映射神經網絡的聚類方法,對捷變頻雷達信號取得了較好的分選效果;文獻[5]提出一種基于密度聚類(DBSCAN)的PDW數據二次分選方法,在一次分選結果的基礎上進一步提取微弱雷達信號,并利用仿真數據驗證了其有效性;文獻[6]針對存在重頻參差、信號交疊、局部脈沖丟失等復雜電磁環境信號分選問題,基于PRI估計變換提出一種聯合數據場和聚類的雷達信號分選方法,具備運算效率高、對噪聲不敏感等優點;文獻[7]和文獻[8]研究了K-Means算法在雷達信號分選領域的應用,針對K-Means算法存在的聚類數目需要預先設定問題,分別利用蟻群算法,數據場方法等對K-Means算法進行優化,自動確定聚類數目的同時能夠獲得較好的信號分選結果。上述分析都是假設接收到的雷達信號信噪比較高,而實際電磁環境較為復雜,接收到的雷達信號不可避免地會混雜著噪聲分量,而噪聲分量的存在會導致PDW數據中也存在隨機噪聲,從而影響隨后的信號分選性能[9]。
本文在上述研究的基礎上,針對K-Means算法存在聚類數目確定及對噪聲數據敏感問題,提出一種基于主成分分析(PCA)模型[1011]聯合K-Means算法的雷達信號分選方法,首先利用PCA算法將PDW投影至特征空間,然后在特征空間中根據特征值分布情況確定聚類個數的同時實現對PDW中存在噪聲分量的抑制,最后利用K-Means算法將主分量個數作為聚類個數,并對噪聲抑制后的數據進行聚類。基于仿真數據的試驗結果表明,所提方法可以獲得更高的正確分選性能,并且具備噪聲穩健性。

(1)設定聚類個數K;
(2)從數據集中任意選出K個樣本作為初始的聚類中心,記為C i1,C i2,…,C iK,上標i表示當前的迭代次數;
(3)計算數據集中每個樣本與當前聚類中心的距離,并將其分配至離它最近的聚類中心對應的子集中,得到K個子集,記為S i1,S i2,…,S iK,樣本與聚類中心之間的距離定義如下:

(4)根據步驟(3)的聚類劃分,按照下式計算當前劃分下的聚類中心,其中n k為第k個子集中的樣本數。如果聚類中心不再發生變化,即C i+1k=C ik,則迭代終止,此時的聚類結果即為誤差平方和最小準則下的最優聚類,若Ci+1k≠C ik,轉至步驟(3)重新進行子集劃分:

從上述步驟可以看出,K-Means算法是根據預設的聚類數目K實現對數據的初始劃分,在此基礎上對初始劃分進行優化,因此聚類數目K的確定對聚類結果影響很大,同時K-Means算法對噪聲數據較為敏感[8,10]。在戰場復雜電磁環境下,很難獲取用于確定聚類數目K的先驗信息,同時截獲的PDW中必然存在一定的噪聲,因此需要一種基于數據驅動的方法實現對聚類中心K的自適應確定,同時該方法要具備對噪聲數據的魯棒性。





表1 仿真雷達參數表
根據所提方法的算法流程,此時可以得到式(8)所示觀測數據矩陣,其中N=450。然后對3個參數向量標準化后分別進行PCA處理,滑窗長度W設置為15,得到的特征值譜如圖1所示,可以看出經過PCA 處理后和三維參數向量呈現出一致的分布特性,即前3個特征值相對較大,第4個特征值以后急劇減小,根據式(5)計算得到大特征值個數均為3,即主分量個數K=3,與雷達個數一致。值得注意的是,在對和三維參數向量進行特征值分解時,并不能保證得到的特征值譜分布特性總是一致的,此時可以采用投票的方式確定最終的主分量個數K。

圖1 歸一化特征值譜圖
在PCA分解的基礎上,設置聚類個數為3,利用K-Means算法對450組噪聲抑制后的脈沖數據和進行聚類,得到的結果如圖2所示。采用正確分選率指標對結果進行定量分析,正確分選率為正確分選的脈沖數與總脈沖數的比值,表2給出了分選結果的混淆矩陣,其中“K-Means”表示采用傳統K-Means方法進行聚類,初始聚類個數設置為2,3,4分別進行試驗得到聚類結果,并將結果進行平均;“蟻群+K-Means”為文獻[8]提出的利用蟻群算法優化K-Means的聚類方法。從圖2和表2所示結果可以看出,所提方法對雷達C 的正確分選率可以達到100%,對雷達A 和雷達B的正確分選率均達到了98%,相對于另外2種方法,所提方法對每一部雷達都可以獲得最優的分選性能。

圖2 聚類結果

表2 分選結果混淆矩陣
為了評估所提方法在低信噪比條件下的分選性能,采取向觀測數據加入高斯白噪聲的方式構造不同的信噪比數據。圖3給出了上述3種方法的正確分選率隨信噪比的變化曲線,可以看出隨著信噪比的降低,3種方法的分選性能都出現不同程度的下降,但是所提方法在不同信噪比條件下的分選性能均優于其它2種方法,特別是當信噪比高于15 d B時所提方法可獲得超過85%的正確分類率,具備較高的噪聲魯棒性。圖4、圖5和圖6分別給出了當信噪比為15 dB時,傳統K-Means方法(K=3),蟻群+K-Means算法和所提方法的聚類結果,可以看出噪聲的存在導致數據分布更加分散,在三維空間中的交疊較為嚴重,K-Means 方法和蟻群+KMeans方法沒有進行噪聲抑制處理,得到的分選結果相對較差。

圖3 不同信噪比條件下的正確分選率

圖4 信噪比為15 dB時K-Means的聚類結果

圖5 信噪比為15 dB時蟻群+K-Means的聚類結果

圖6 信噪比為15 dB時所提方法的聚類結果
隨著電磁環境的愈加復雜,傳統基于直方圖和K-Means的聚類方法逐漸不能滿足實際需要。本文在K-Means聚類方法的基礎上,將PCA引入信號分選領域,提出一種基于PCA聯合K-Means聚類的噪聲穩健雷達信號分選方法,利用PCA對PDW數據進行噪聲抑制處理并自動確定K-Means算法的初始類別數,然后利用K-Means對噪聲抑制后的數據進行聚類。最后采用仿真數據對所提方法在不同信噪比條件下的分選性能進行驗證,從實驗結果可以看出,噪聲的存在導致PDW分布特性發生變化,并影響最終的聚類結果,而PCA具備的噪聲魯棒特性,在實現噪聲抑制的同時保持原始PDW的分布特性,從而可以在低信噪比條件下獲得較好的正確分選結果。當然,該技術作為信號分選方法新的探索,在未來工程裝備的成熟使用還需開展進一步研究。