摘 要:針對K-均值算法需要事先確定聚類的數目,無法適用于未知雷達信號分選的問題,通過引入脈沖間歐幾里德距離和距離閾值TMS2812,完成聚類數目和聚類中心的自動選取,給出一個K-均值的改進算法,改進后的算法既收斂速度快,易于工程化實現,又可自動確定聚類數目和聚類中心。仿真實驗表明,該改進算法提高了K-均值算法的適用范圍,能夠有效適應于未知雷達信號的分選。
關鍵詞:K-均值; 雷達信號分選; 聚類數目; 聚類中心
中圖分類號:TN95-34文獻標識碼:A
文章編號:1004-373X(2010)17-0091-03
Unknown Radar Signals Deinterleaving Based on Improved K-means Algorithm
SUN Xin, HOU Hui-qun, YANG Cheng-zhi
(Aviation University of Air Force, Changchun 130022, China)
Abstract: Since K-means algorithm can not be used for the deinterleaving of the unknown radar signals and needs to make sure the clustering number beforehand, an improved K-means algorithm is proposed based on the introduction of Euclidean distance and the distance threshold value, and the achievement of the automatic selection for the clustering number and clustering center. The algorithm can keep the original advantage and doesn't need the clustering number. The simulation shows that this algorithm enlarges the application range of K-means algorithm and can successfully deinterleave unknown radar signals.
Keywords: K-means; signal deinterleaving; clustering number; clustering center
0 引 言
雷達信號分選的研究起于20世紀70年代,當時雷達體制較為簡單,分選難度不大。隨著新體制雷達的大量出現并列入裝備使用,現有的電磁環境越來越復雜,使得傳統基于直方圖的分選算法越來越難以適應分選的要求。近年來一些聚類算法被嘗試到信號的分選領域中來,比如空間距離聚類、K-均值聚類、模糊聚類、BFSN聚類等,在這些聚類中K-均值聚類因算法思想簡單,易于實現并且收斂速度快等優點,受到科研人員的青睞。但K-均值算法最大的局限性在于聚類的數目需要事先確定,這一要求在實際電子對抗偵察中幾乎是不能滿足的,這也大大限制了K-均值算法在未知信號分選中的應用。
從目前文獻來看,大多數應用K-均值算法的論文中聚類數都是人為設定的。也有少量文獻將該算法與其他算法進行結合,使得自動確定聚類數和聚類中心,如將蟻群算法與K-均值算法結合[1],遺傳算法與K-均值算法結合[2],以此來確定K-均值聚類的聚類數目,但這些方法存在計算繁瑣,運算量較大,難以工程化實現等缺點。因而,如何對K-均值進行相應的改進,使得改進算法在保留算法編程思想簡單,易工程化實現等優點的基礎上,能夠自動確定聚類的數目和聚類中心,便顯得意義重大。
本文針對這一問題展開研究,借助文獻[3]中的思想對K-均值算法進行改進處理。改進算法自動確定聚類中心和聚類數目,使得算法適應未知信號分選的能力增強。仿真實驗驗證了其有效性。
1 K-均值算法原理
K-均值算法使用的聚類準則函數是誤差平方和準則。該算法的思想是將N個對象進行K個類的劃分(K≤N)。其算法步驟如下:
(1) 任選K個初始聚類中心Z(1)2,Z(1)3,…Z(1)K,其中,上角標表示聚類過程中的迭代運算次數。
(2) 假設已進行到第r次迭代,若對某一樣本x有:
d(x,z(r)j)=min{d(x,z(r)i),i=1,2,…,K}
(1)
則x∈S(r)j。式中d(x,z(r)j)為樣本x~z(r)j間的距離,S(r)j是以z(r)j為聚類中心的樣子子集。以此種方法,即最小距離原則,將全部樣本分配到K個聚類中。
(3) 計算重新分類后的各聚類中心
z(r+1)j=1n(r)j∑x∈S(r)jX,j=1,2,…,K
(2)
式中:n(r)j為S(r)j中所包含的樣本數。
(4) 若z(r+1)j=z(r)j,j=1,2,…,K,則結束;否則轉步驟(2)。
2 改進的K-均值算法
改進K-均值算法思想是通過設定距離閾值TMS2812,將脈沖間的歐幾里德距離與距離閾值TMS2812進行比較,按照一定準則,完成聚類中心和聚類數目的動態確定。在進行分選前,需完成脈沖的數值處理、特征參量選擇以及閾值TMS2812設定等工作。
2.1 數值處理
改進的K-均值算法采用加權歐幾里德距離表征脈沖信號參數之間的距離[3]。
r=[(x-u)TW(x-u)]1/2
(3)
式中:x表示脈沖參數的測量值;u表示脈沖聚類中心的參數值;它隨聚類運算的進行完成更新;W表示加權矩陣。
設Δ=x-u,當用多脈沖參數進行表征時:
Δ=Δ1Δ2Δn
(4)
脈沖參數加權矩陣為:
W=W10…00W2…000…Wn
(5)
則脈沖參數之間的幾何距離為:
r=[Δ1Δ2…Δn]×W10…00W2…000…Wn
×Δ1Δ2Δn1/2
(6)
為便于計算,在參數進行運算之前,先進行歸一化處理。歸一化的方法可根據實際情況進行設置。此處采用下列歸一化公式:
x=x-xminxmax-xmin
(7)
式中:xmin表示該參數集合中的最小值;xmax表示該參數集合中的最大值。如果特征參量選擇為DOA,RF和PW時,則xmin,xmax表示DOA,RF和PW的最小值和最大值。
2.2 特征參量選擇與閾值TMS2812設定
雷達的脈沖描述字PDW包括RF,DOA,PW,PA,在不考慮脈內信息的情況下,此處選擇DOA,RF和PW作為特征參量。
上面提到脈沖信號之間的相似度用歐幾里德距離表征,距離越小,相似度越大。此處設定一個參數Sd,作為該歐幾里德距離的門限。
2.3 改進K-均值算法步驟
改進K-均值聚類算法的步驟如下:
(1) 在進行聚類之前,設定好距離門限Sd、最大迭代次數iteNum,將迭代次數計數器counter至于0,標志位變量change置于1(用以表征是否完成類的更新),并選取第一個點作為聚類中心。
(2) 讀取新的脈沖參數,將其與已有的聚類中心點計算加權距離,得到最小的距離Distance_min,再將Distance_min與Sd進行比較,如果Distance_min
(3) 更新各聚類中心特征值。
(4) 判斷counter (5) 將change賦值為0;counter加1。 (6) 重新讀取脈沖參數,計算該對象到自身類中心的距離和到其他類中心的距離。如果它到其他類中心的距離更小,則將其歸為離它距離小的類,并更新change=1,跳到步驟(3)。否則重復該步,直到所有脈沖都計算一遍或滿足類更新條件為止。 2.4 改進算法流程圖 改進的K-均值算法流程圖如圖1所示。 圖1 改進算法流程圖 3 仿真實驗 為驗證改進算法的有效性,此處借助Matlab進行仿真測試。本次的仿真中通過DOA,RF,PW參數完成測試。 (1) 仿真1:常規雷達分選測試 選用3部常規體制雷達。3部雷達類型和參數見表1。 表1 雷達類型和參數 輻射源類型DOA /(°)RF /GHzPW /μs脈沖數 1常規體制325.22.0100 2常規體制295.44.6100 3常規體制343.81.2100 經過程序驗證,很容易將上述脈沖分為3類,與真實情況相符,成功率達到100%。 (2) 仿真2:復雜體制雷達分選測試 在實際情況下,雷達體制復雜,脈沖流不僅表現在時間軸上的交錯,在其他脈沖參數上也表現為出現部分混疊的情況。典型的例子是兩部頻率捷變雷達在頻域上的數值混疊。仿真2在考慮實際情況下對算法進行仿真分析,表2為雷達類型和參數表。 表2 雷達類型和參數 輻射源類型DOA /(°)RF /GHzPW /μs脈沖數 1重頻固定 頻率捷變 脈寬固定50~554.95~5.052.5100 2重頻抖動 頻率跳變 脈寬固定48~524.90~5.001.7100 3重頻滑變頻率捷變 脈寬固定54~575.0~5.22.3100 經過仿真,聚類前到達角-載頻分布圖如圖2所示。 圖2 聚類前到達角-載頻分布圖 經過聚類以后的結果二維顯示和三維顯示分布圖見圖3、圖4(圖中用點表示雷達1,用圈表示雷達2,用下三角表示雷達3)。 圖3 聚類結果二維顯示圖 從仿真圖上可以看出,改進算法能夠自動將這些對象聚類成3類,與實際情況相符。從圖4中可以看到,在聚類的過程中,除有一個屬于雷達1的對象被聚類到雷達3中外,其余聚類結果都是正確的,改進后的算法具有較高的準確性。 圖4 聚類結果三維顯示圖 4 結 語 對近年來引入到信號分選領域中的K-均值算法展開研究,主要針對傳統K-均值算法需要先驗知識,無法有效應用于未知雷達信號的分選的問題。經過對仿真結果分析,結論如下: (1) 改進后的算法只需設定初始距離閾值TMS2812,就能夠自動確定聚類數目和聚類中心,并完成相應的聚類,有效地適用于未知信號的分選。 (2) 仿真實驗表明,改進算法能夠準確完成常規體制雷達的分選,同時對于重頻抖動、重頻滑變、頻率跳變和頻率捷變等復雜體制雷達也有很好的分選效果。 (3) 本文給出改進算法流程圖,易于工程化實現。 雖然文中提到的改進算法能夠自動地完成聚類數目和聚類中心的確定,但仍然需要借助于距離閾值TMS2812的人為設定,現階段距離閾值TMS2812主要是通過經驗和實驗得到。關于距離閾值TMS2812的優化或動態設定還需要進一步深入研究。 參考文獻 [1]孫秀娟.基于遺傳算法的K-means聚類算法分析研究[D].濟南:山東師范大學,2009. [2]趙貴喜,駱魯秦,陳彬.基于改進的蟻群聚類雷達信號分選算法研究[J].電子信息對抗技術,2009(3):27-29. [3]祝正威.雷達信號的聚類分選方法[J].電子對抗,2005(6):6-10. [4]韓俊,何明浩,朱元清.基于多參數的雷達輻射源分選新方法[J].數據采集與處理,2009(1):91-94. [5]李峰.復雜環境下雷達輻射源信號分選算法研究[D].西安:西安電子科技大學,2009. [6]曹俊紡,陳建軍,孟曉琳.雷達信號分選技術研究[J].雷達與對抗,2009(1):20-22. [7]張紅昌,阮懷林,龔亮亮,等.一種新的未知雷達輻射源聚類分選方法[J].計算機工程與應用,2008,44(27):200-201. [8]陳惠民,盛驥松.一種新的雷達信號分選方法[J].現代電子技術,2009,32(1):20-22. [9]何明浩,朱元清,冒燕,等.一種雷達輻射源信號分選新方法[J].武漢理工大學學報:交通科學與工程版,2007(3):430-433. [10]張興華,李東海,陳國沖.基于SVC和信息熵的雷達信號分選系統[J].艦船電子對抗,2009(3):38-41.