賈然,胡進(jìn)
(南京船舶雷達(dá)研究所,江蘇 南京 211106)
一種基于數(shù)據(jù)場(chǎng)聚類的雷達(dá)信號(hào)分選算法*
賈然,胡進(jìn)
(南京船舶雷達(dá)研究所,江蘇 南京 211106)
針對(duì)傳統(tǒng)聚類算法在雷達(dá)信號(hào)分選中存在的一些問(wèn)題,提出了一種基于數(shù)據(jù)場(chǎng)聚類的信號(hào)分選算法。首先所有數(shù)據(jù)樣本經(jīng)過(guò)歸一化計(jì)算,根據(jù)數(shù)據(jù)場(chǎng)理論計(jì)算樣本的勢(shì)值,通過(guò)尋找極大值點(diǎn)及其個(gè)數(shù)確定初始聚類中心和聚類數(shù)目,之后重新計(jì)算聚類中心。通過(guò)對(duì)頻率捷變雷達(dá)的實(shí)驗(yàn)仿真,驗(yàn)證了算法的有效性。
雷達(dá)信號(hào)分選;數(shù)據(jù)場(chǎng);聚類;頻率捷變;等勢(shì)線;Matlab
復(fù)雜電磁環(huán)境下的雷達(dá)輻射源信號(hào)分選是雷達(dá)情報(bào)偵察的重要組成部分,是衡量雷達(dá)對(duì)抗情報(bào)處理能力的關(guān)鍵因素[1]。對(duì)于已知的雷達(dá)信號(hào),依賴于先驗(yàn)知識(shí),其處理的準(zhǔn)確性和實(shí)時(shí)性已經(jīng)得到了實(shí)踐驗(yàn)證。但對(duì)于未知雷達(dá)信號(hào)的分選則一直是雷達(dá)對(duì)抗情報(bào)處理中的難題[2]。雷達(dá)信號(hào)分選算法有待進(jìn)一步的發(fā)展,從而適應(yīng)如今日益復(fù)雜的信號(hào)環(huán)境。
聚類[3]是數(shù)據(jù)挖掘中的重要技術(shù),是將物理或者抽象對(duì)象的集合分成由類似的對(duì)象組成的多個(gè)類的過(guò)程,被廣泛地應(yīng)用于雷達(dá)信號(hào)分選當(dāng)中[4]。文獻(xiàn)[5]采用k- 均值聚類算法雷達(dá)信號(hào)進(jìn)行分選,利用歐式距離來(lái)描述脈沖之間的關(guān)聯(lián)性,取得了不錯(cuò)的效果,但該算法需人為設(shè)定聚類數(shù)目,且噪聲數(shù)據(jù)對(duì)其影響很大。文獻(xiàn)[6]通過(guò)相似系數(shù)來(lái)代替歐式距離,用小波系數(shù)和傳統(tǒng)參數(shù)聯(lián)合分選,分選正確率達(dá)到96.2%,但是該算法不能動(dòng)態(tài)獲取初始的聚類中心和聚類數(shù)目。文獻(xiàn)[7]提出了數(shù)據(jù)場(chǎng)的概念,將數(shù)據(jù)參數(shù)引入場(chǎng)空間,通過(guò)數(shù)據(jù)場(chǎng)中的輻射因子確定各層面數(shù)據(jù)的抱團(tuán)特征,精準(zhǔn)地找到初始中心聚類點(diǎn),具有較好的可行性。因此,本文提出了一種基于數(shù)據(jù)場(chǎng)聚類的雷達(dá)信號(hào)分選算法,將雷達(dá)信號(hào)數(shù)據(jù)引入數(shù)據(jù)場(chǎng)空間進(jìn)行處理,利用數(shù)據(jù)場(chǎng)中勢(shì)的概念,能夠自動(dòng)形成聚類數(shù)目和聚類中心,用歐氏距離表征信號(hào)參數(shù)之間的關(guān)聯(lián)性。該算法適合于各類復(fù)雜體制雷達(dá)信號(hào)分選,對(duì)噪聲影響不敏感,不需要先驗(yàn)知識(shí),具有較好的分選效果。
場(chǎng)的概念是英國(guó)物理學(xué)家法拉第在1837年提出的,開始是來(lái)描述物質(zhì)粒子間的非接觸互相作用。隨著場(chǎng)論思想的逐漸發(fā)展,其被抽象為一個(gè)數(shù)學(xué)概念,用于表征某個(gè)物理量或者數(shù)學(xué)函數(shù)在空間的分布規(guī)律。在實(shí)際世界里,各個(gè)對(duì)象之間是相互聯(lián)系、相互作用的,所以反映現(xiàn)實(shí)世界的數(shù)據(jù)之間也存在著相互聯(lián)系、相互作用。從而進(jìn)行聚類分析的數(shù)據(jù)并不是孤立空間中的每一個(gè)數(shù)據(jù),可能對(duì)整個(gè)空間中的其他數(shù)據(jù)都具有一定影響力,例如各個(gè)物體之間的萬(wàn)有引力、點(diǎn)電荷之間的電場(chǎng)力,每個(gè)數(shù)據(jù)在整個(gè)數(shù)域空間的影響力可以看成一種數(shù)據(jù)場(chǎng)[8],數(shù)據(jù)場(chǎng)是一種客觀存在的媒介。數(shù)據(jù)通過(guò)數(shù)據(jù)場(chǎng)與其他數(shù)據(jù)發(fā)生相互作用,數(shù)據(jù)場(chǎng)是一種虛擬空間場(chǎng),用于描述和計(jì)算單個(gè)數(shù)據(jù)對(duì)整個(gè)空間作用,數(shù)據(jù)在空間輻射能量的規(guī)律用場(chǎng)強(qiáng)函數(shù)[9-10]來(lái)表達(dá)。數(shù)據(jù)發(fā)射其能量的形式和特性的不同將導(dǎo)致描述數(shù)據(jù)場(chǎng)的場(chǎng)強(qiáng)函數(shù)的差異[11]。常用高斯影響函數(shù)來(lái)表述場(chǎng)強(qiáng)數(shù)據(jù)對(duì)象x在數(shù)據(jù)場(chǎng)中y點(diǎn)產(chǎn)生的場(chǎng)強(qiáng)函數(shù)度量如下:
(1)
式中:σ為輻射因子,表示數(shù)據(jù)點(diǎn)的影響力,在數(shù)據(jù)場(chǎng)中的影響就表現(xiàn)為等勢(shì)線的間距,取常數(shù);ρ反映該數(shù)據(jù)點(diǎn)的數(shù)據(jù)量,正常情況下取常數(shù);d(x,y)表示數(shù)據(jù)點(diǎn)x到點(diǎn)y的歐式距離。
勢(shì)函數(shù)定義為數(shù)據(jù)場(chǎng)中任何一點(diǎn)y上所有數(shù)據(jù)點(diǎn)的影響之和。對(duì)于由n個(gè)數(shù)據(jù)點(diǎn)構(gòu)成的場(chǎng)空間中任一點(diǎn)y的勢(shì)函數(shù)定義為
(2)
由式(2)可知,勢(shì)值和距離成反比,也就是說(shuō)數(shù)據(jù)密集的地方勢(shì)值大,數(shù)據(jù)稀疏的地方密度小。
2.1 數(shù)據(jù)場(chǎng)聚類
雷達(dá)偵察接收機(jī)輸出到雷達(dá)信號(hào)處理的是密集重疊的脈沖流,每個(gè)脈沖以脈沖描述字(pulse description word,PDW)的形式來(lái)表示,每一個(gè)脈沖描述字主要包含以下5個(gè)參數(shù):到達(dá)時(shí)間(time of arrival,TOA)、脈沖幅度(pulse amplitude,PA)、脈沖頻率(radio frequency,RF)、脈沖寬度(pulse width,PW)、到達(dá)角(direction of arrival,DOA)。雷達(dá)信號(hào)分選就是從這種隨機(jī)交疊的脈沖流中分離出每一部雷達(dá)脈沖序列的過(guò)程[12]。數(shù)據(jù)場(chǎng)的引入一定程度上解決了空間信息和屬性信息相互分割的問(wèn)題,為二者互相耦合解決實(shí)際問(wèn)題提供了一個(gè)橋梁。
等勢(shì)線是一種把數(shù)據(jù)場(chǎng)勢(shì)值相等的點(diǎn)連起來(lái)形成的線,由等勢(shì)線圍繞形成的中心叫做勢(shì)心[13]。勢(shì)心是眾多數(shù)據(jù)樣本在單個(gè)或幾個(gè)以上的屬性數(shù)據(jù)值中所體現(xiàn)的極值特征。因?yàn)閯?shì)心是一定范圍內(nèi)勢(shì)值的極大值點(diǎn),通過(guò)勢(shì)心的數(shù)目和位置,就能找出初始聚類中心和初始聚類數(shù)目。但是通過(guò)抽象出來(lái)的勢(shì)心和樣本數(shù)據(jù)本身不一定重合,所以應(yīng)該選擇距離勢(shì)心最近的樣本數(shù)據(jù)作為初始聚類中心。根據(jù)等勢(shì)線圖,可以較為直接地發(fā)現(xiàn)勢(shì)心的位置,數(shù)學(xué)語(yǔ)言描述如下:
(3)
式中:Fmax為勢(shì)心值;F(i,j)為勢(shì)心周圍的勢(shì)值;(i,j)表示點(diǎn)所在的位置。
2.2 基于數(shù)據(jù)場(chǎng)聚類的雷達(dá)信號(hào)分選算法
雷達(dá)接收到的PDW中,根據(jù)到達(dá)時(shí)間(TOA)計(jì)算得到的脈沖重復(fù)頻率(pulse repetition frequency,PRF)工作方式多、變化快,一般不作為預(yù)分選的依據(jù),因此本文采用脈沖頻率(RF)、脈沖寬度(PW)、到達(dá)角(DOA)進(jìn)行分選。
為了確保聚類的科學(xué)性,多維聚類中信號(hào)的各維參數(shù)值要求處在同一數(shù)量級(jí)上。所以在參數(shù)進(jìn)行計(jì)算之前先進(jìn)行歸一化的處理,對(duì)于n個(gè)PDW=(RF,PW,DOA),其歸一化的過(guò)程如下:
(4)
式中:i=1,2,…,n。
經(jīng)過(guò)歸一化處理之后的脈沖描述字為
pdw=(rf,pw,doa),
式中:rf,pw,doa均為n維的列向量;pdw為n×3的矩陣。
數(shù)據(jù)場(chǎng)中任一點(diǎn)M的勢(shì)值為
(5)
(6)
式中:輻射因子σ值的大小會(huì)影響等勢(shì)線的間隔,σ值的大小與單個(gè)數(shù)據(jù)點(diǎn)的影響范圍成正比,與等勢(shì)線稀疏成反比;ρ反映該數(shù)據(jù)點(diǎn)的數(shù)據(jù)量,經(jīng)驗(yàn)證明對(duì)聚類結(jié)果沒(méi)有影響,ρ取常數(shù)1;pdwi表示pdw的第i行,即第i個(gè)數(shù)據(jù)樣本。通過(guò)計(jì)算找出數(shù)據(jù)場(chǎng)中點(diǎn)勢(shì)值的極大值,極大值的個(gè)數(shù)作為聚類數(shù)目k,距離極大值最近的點(diǎn)作為初始聚類中心pdwi(i=1,2,…,k);之后計(jì)算各個(gè)數(shù)據(jù)樣本點(diǎn)到每個(gè)聚類中心的距離,把數(shù)據(jù)樣本劃分到離它最近的那個(gè)中心所代表的類pdwj中,然后分別計(jì)算新產(chǎn)生的類中數(shù)據(jù)樣本的均值,把得到的均值作為新的聚類中心,把新的聚類中心和之前一次得到的中心進(jìn)行比較,如果沒(méi)有產(chǎn)生變化或者變化極小,則算法收斂,得到結(jié)果;反之假如新的中心和之前一次的中心對(duì)比產(chǎn)生了變化,就要依據(jù)新的聚類中心對(duì)所有數(shù)據(jù)樣本重新進(jìn)行劃分。直到滿足算法的收斂條件為止。本文收斂條件采取誤差平方和準(zhǔn)則函數(shù):
(7)

算法步驟總結(jié)如下:
(1) 根據(jù)式(4)樣本歸一化;
(2) 根據(jù)式(5),(6)計(jì)算每個(gè)點(diǎn)的勢(shì)值,再用式(3)找出數(shù)據(jù)場(chǎng)內(nèi)的極大值點(diǎn)最近的樣本點(diǎn)作為初始聚類中心,極大值的個(gè)數(shù)作為初始聚類數(shù)目;
(3) 計(jì)算每個(gè)數(shù)據(jù)點(diǎn)到這些聚類中心的距離,并把數(shù)據(jù)樣本劃分到相應(yīng)的類中;
(4) 對(duì)于每一類,重新計(jì)算其聚類中心,直到滿足收斂條件即聚類中心不再變化為止,算法結(jié)束,否則跳轉(zhuǎn)到步驟(3)。
為了驗(yàn)證本文算法的有效性,使用Matlab進(jìn)行仿真實(shí)驗(yàn)。實(shí)驗(yàn)仿真選用的4部頻率捷變雷達(dá)參數(shù)如表1所示。
表1所示的就是4部雷達(dá)的參數(shù),在不考慮脈沖丟失的情況下,每部雷達(dá)參數(shù)都有一定的測(cè)量誤差(誤差為高斯噪聲)。在較短的時(shí)間內(nèi),可以認(rèn)為DOA不發(fā)生變化,RF,PW是不斷變化的。
在實(shí)際仿真中,考慮到計(jì)算的復(fù)雜度問(wèn)題,把三維的雷達(dá)參數(shù)降階為二維的來(lái)處理,選取RF,PW,DOA參數(shù)進(jìn)行兩兩計(jì)算,從而復(fù)雜度從原來(lái)的O(n3)降為O(n2)。經(jīng)過(guò)仿真處理,利用數(shù)據(jù)場(chǎng)理論得到的勢(shì)值分布通過(guò)等勢(shì)線的形式表示出來(lái),如圖1~3所示(·代表雷達(dá)1,+代表雷達(dá)2,*代表雷達(dá)3,○代表雷達(dá)4)。
從圖1~3可以看出,輻射因子σ對(duì)等勢(shì)線的分布具有很大的影響。數(shù)據(jù)樣本的影響距離與σ值的大小成正比。圖1~3可以看出,σ取不同值時(shí)等勢(shì)線的分布情況。如果σ值取得很大,該數(shù)據(jù)場(chǎng)空間就看成僅有一個(gè)勢(shì)心的數(shù)據(jù)樣本,從而反映不了數(shù)據(jù)樣本準(zhǔn)確的分布情況,因此選取恰當(dāng)?shù)挠绊懸蜃应绎@得尤為重要。本文選取σ=0.1[14],圖1~3可以直觀地看出雷達(dá)信號(hào)分為4類,初步結(jié)果如表2所示。

表1 雷達(dá)仿真參數(shù)
初始聚類中心經(jīng)過(guò)重新計(jì)算得到最終聚類中心結(jié)果如表3所示。
本文算法與傳統(tǒng)的傳統(tǒng)聚類算法比如k- 均值聚類算法[15]相比較分選效果,由于k- 均值聚類算法會(huì)隨機(jī)選取聚類中心和數(shù)目,得到的結(jié)果也會(huì)不同,為了便于比較,仿真100次取平均值與本文算法相比較。本文算法的迭代次數(shù)為4,而k- 均值聚類算法平均迭代次數(shù)為13,大大降低了運(yùn)算量;正確分選概率的也從k- 均值聚類算法88.91%提高到98.59%。正確分選概率公式為

圖1 載頻和脈寬的等勢(shì)線分布Fig.1 RF and PW of the equipotential lines distribution

圖2 載頻和到達(dá)角的等勢(shì)線分布Fig.2 RF and DOA of equipotential lines distribution

圖3 脈寬和到達(dá)角的等勢(shì)線分布Fig.3 PW and DOA of equipotential lines distribution

雷達(dá)序號(hào)RFPWDOA10.52220.37600.030120.36660.48800.318630.82980.36910.677440.24180.71710.8918

表3 最終聚類中心

(8)
4部雷達(dá)的分選結(jié)果如表4所示。

表4 分選結(jié)果
針對(duì)傳統(tǒng)聚類算法需要預(yù)先設(shè)定聚類中心和聚類數(shù)目,無(wú)法有效應(yīng)用于雷達(dá)信號(hào)分選的情況,本文把數(shù)據(jù)場(chǎng)的概念應(yīng)用到信號(hào)分選領(lǐng)域并展開研究。本文算法通過(guò)對(duì)勢(shì)值的分析,就能確定聚類數(shù)目和聚類中心。經(jīng)過(guò)Matlab仿真驗(yàn)證,基于數(shù)據(jù)場(chǎng)聚類的雷達(dá)信號(hào)分選算法對(duì)復(fù)雜體制雷達(dá)具有較好的分選效果。
文中提到的算法雖然能夠完成對(duì)聚類數(shù)目和聚類中心的確定,使正確分選概率得到提高,但是沒(méi)有考慮脈沖丟失的情況,還需作進(jìn)一步的研究。輻射因子σ主要是通過(guò)經(jīng)驗(yàn)和實(shí)驗(yàn)得到,有關(guān)輻射因子σ的優(yōu)化和設(shè)定還有待探討。
[1] 陸志宏.雷達(dá)偵察系統(tǒng)信號(hào)處理技術(shù)探討[J].艦船電子對(duì)抗,2005,28(3):38-43. LU Zhi- hong.Research on Signal Processing Technology of Radar Reconnaissance System[J].Ship Electronic Countermeasure,2005,28(3):38-43.
[2] 何明浩.雷達(dá)對(duì)抗信息處理[M].北京:清華大學(xué)出版社,2010. HE Ming- hao.Radar Countermeasure Information Processing[M].Beijing:Tsinghua University Press,2010.
[3] XU Rui,WUNSCH D.Survey of Clustering Algorithms[J].IEEE Transactions on Neural Networks,2005,16(3):645-678.
[4] 岳宏偉,羅景青,呂久明,等.雷達(dá)信號(hào)非均勻粒度聚類分選方法[J].火力與指揮控制,2008,33(8):23-26. YUE Hong- wei,LUO Jing- qing,Lü Jiu- ming,et al.Non Uniform Particle Size Clustering Algorithm for Radar Signals[J].Fire Control & Command Control,2008,33 (8):23-26.
[5] 張莉,孫鋼,郭軍.基于K- 均值聚類的無(wú)監(jiān)督的特征選擇方法[J].計(jì)算機(jī)應(yīng)用研究,2004,23(3):23-24,42. ZHANG Li,SUN Gang,GUO Jun.Unsupervised Feature Selection Method Based onK- Mean Clustering[J].Research and Application of Computer,2004,23 (3):23-24,42.
[6] 馮明月,何明浩,王冰切.基于改進(jìn)相似熵的參數(shù)交疊雷達(dá)信號(hào)分選[J].電子信息對(duì)抗技術(shù),2013,28(4):1-4. FENG Ming- yue,HE Ming- hao,WANG Bing- qie.Improved Parameter Similar Entropy Overlapping Radar Signal Sorting[J].Electronic Warfare Technology Based on 2013,28(4):1-4.
[7] 王海軍,鄧羽,王麗,等.基于數(shù)據(jù)場(chǎng)的C均值聚類方法研究[J].武漢大學(xué)學(xué)報(bào),2009,34(5):626-629. WANG Hai- jun,DENG Yu,WANG Li,et al.Research on the C- mean Clustering Method Based on Data Field[J].Journal of Wuhan University,2009,34(5):626-629.
[8] 淦文燕,李德毅,王建民.一種基于數(shù)據(jù)場(chǎng)的層次聚類方法[J].電子學(xué)報(bào),2006,34(2):258-262. GAN Wen- yan,LI De- yi,WANG Jian- min.A Hierarchical Clustering Method Based on Data Field[J].Journal of Electronics,2006,34 (2):258-262.
[9] 李德仁,周月琴,金為銑.攝影測(cè)量與遙感概論[M].北京:測(cè)繪出版社,2001. LI De- ren,ZHOU Yue- qin,JIN Wei- xi.Photogrammetry and Remote Sensing Survey[M].Beijing:Surveying and Mapping Press,2001.
[10] 張紅昌,龔亮亮,阮懷林,等.一種新的未知雷達(dá)輻射源聚類分選方法[J].計(jì)算機(jī)工程與應(yīng)用,2008,44(27):200-202. ZHANG Hong- chang,GONG Liang- liang,RUAN Huai- lin,et al.An Unknown Radar Emitter Sorting Method Based on the New[J].Computer Engineering and Applications,2008,44 (27):200-202.
[11] 余建橋,基于數(shù)據(jù)場(chǎng)改進(jìn)的PAM聚類算法[J].計(jì)算機(jī)科學(xué),2005,32 (1):165-168. YU Jian- qiao,The Data Field Improved PAM Clustering Algorithm[J].Based on Computer Science,2005,32 (1):165-168.
[12] 羅景青,賀平.雷達(dá)對(duì)抗原理[M].合肥:解放軍電子工程學(xué)院出版社,2003. LUO Jing- qing,HE Ping.The Principle of Radar Countermeasure[M].Hefei:Electronic Engineering Institute Press,2003.
[13] 李興生.基于云模型和數(shù)據(jù)場(chǎng)的分類和聚類挖掘研究[D].南京:解放軍理工大學(xué),2003. LI Xing- sheng.Classification and Clustering Mining Based on Cloud Model and Data Field[D].Nanjing:PLA University of Science and Technology,2003.
[14] 國(guó)強(qiáng),宋文明,南浦龍,等.基于數(shù)據(jù)場(chǎng)與云模型的多模雷達(dá)信號(hào)分選算法[J].哈爾濱工業(yè)大學(xué)學(xué)報(bào),2015,47(11),76-81. GUO Qiang,SONG Wen- ming,NAN Pu- long,et al.Data Field and Cloud Model of Multi- Mode Radar Signal Sorting Slgorithm[J].Journal of Harbin Institute of Technology,2015,47 (11),76-81.
[15] 聶曉偉.基于K- Means算法的雷達(dá)信號(hào)預(yù)分選方法[J].電子科技,2013,26(11):55-58. NIE Xiao- wei.Radar Signal Pre Sorting AlgorithmK- Means Algorithm[J].Electronic Science and Technology,2013,26 (11):55-58.
A Radar Signal Sorting Algorithm Based on Data Field Clustering
JIA Ran,HU Jin
(Nanjing Marine Radar Institute,Jiangsu Nanjing 211106,China)
Aimed at some problems existing in radar signal sorting based on the traditional clustering algorithm, a new signal sorting algorithm based on data field clustering is proposed. All data samples are calculated for normalization. According to the data field theory calculation sample of potential value, the initial clustering center and number are determined by finding the maxima and its numbers, and the cluster centers are recalculated. The effectiveness of the proposed algorithm is verified through the experimental simulation of frequency agility radar.
radar signal sorting;data field;clustering;frequency agility;equipotential line;Matlab
2016-09-18;
2016-11-18 作者簡(jiǎn)介:賈然(1992-),男,江蘇泰州人。碩士生,主要研究方向?yàn)槔走_(dá)信號(hào)處理。
10.3969/j.issn.1009- 086x.2017.04.020
TN957.5;TP391.9
A
1009- 086X(2017)- 04- 0124- 06
通信地址:211106 江蘇省南京市江寧區(qū)長(zhǎng)青街30號(hào) E- mail:913117186@qq.com