朱學鋒
(中國人民解放軍92941部隊,遼寧 葫蘆島 125000)
?
基于最近鄰聚類分析的多站遙測數據融合方法
朱學鋒
(中國人民解放軍92941部隊,遼寧 葫蘆島 125000)
摘要:為研究多測站遙測數據智能對接方法,提供高質量全彈道遙測數據,利用多傳感器信息融合技術,采用最近鄰聚類分析算法實現目標識別級多測站遙測數據融合。以某次試驗5個測站的遙測數據為例進行了仿真測試,測試結果表明:該方法能從多個測站中遴選出最優遙測數據幀,經整合重組后實現多測站原始遙測數據融合,有效剔除非正常跟蹤遙測數據,提高了數據處理效率和質量。
關鍵詞:遙測數據;聚類分析;最近鄰算法;數據融合
飛航式導彈試驗的全程遙測數據是由多個陸上和海上測量站、船接力測量完成的。為保證記錄到全程遙測數據,通常需要接力測量并在導彈飛行的各個階段確保有2套以上的測量結果。在對遙測數據事后處理之前,需要對這些原始測量數據進行質量檢查,從有冗余的測量數據中,選擇記錄質量最好的遙測數據重新組合,形成新的全彈道遙測數據。傳統的數據處理方法是首先解析各地面接收站記錄的遙測數據并提取全部或部分參數,通過觀察參數曲線圖的記錄質量評估原始遙測數據的優劣,并生成各測站遙測數據記錄質量檢查表,進而建立多站遙測數據對接表。在數據對接表的基礎上以對接點時間為基準截取各測站的遙測數據進行對接,并將對接點前后相同的10幀信號進行對比校驗。這種方法步驟繁瑣,需要較多的人工干預,影響了遙測數據檢查的效率和數據對接的質量。文獻[1]采用遙測數據的幀同步碼和幀計數作為數據融合的基準,忽略了幀時間延遲和幀數據匹配程度的問題,對精細化數據分析會有一定影響。本文提出了一種基于最近鄰聚類分析算法實現遙測數據融合的新方法,能夠精確、高效地完成多測站遙測數據的子幀數據選優和重組,有效剔除干擾信號,提供高質量的全彈道遙測數據。
1多測站遙測數據的融合結構
多傳感器信息融合[3-4]的基本原理就是充分利用多個傳感器資源,合理支配與使用各傳感器及其觀測信息,依據某種準則對各傳感器在空間和時間上互補或冗余的信息進行自動分析和優化綜合,最大限度地獲取被探測目標和環境的信息量,并對探測目標和環境形成相對完整、一致的描述。
遙測數據是由群路數據組成的,幀是群路數據的基本單元,其幀格式如圖1所示。圖中,N為子幀長度,M為副幀長度,W為波道號。

圖1 遙測幀數據格式
原始遙測數據是各測控站實時測控獲取的遙測數據流文件,具有圖2所示結構[2]。

圖2 原始遙測數據結構
按照信息抽象的層次,融合分為檢測級、位置級、目標識別級、態勢評估和威脅估計等5個級別[3-5]。根據遙測數據的特點,遙測數據的多傳感器數據融合可以在目標識別級的數據層融合和特征層融合2個層次上進行。
數據層融合是在原始數據級實現數據融合。首先將各測站接收的遙測數據傳輸到數據處理中心進行集中式的融合處理,再提取各參數供后期處理和分析評估使用,其融合結構如圖3所示。原始數據級融合結構更適合于事后的數據處理。

圖3 遙測數據級融合結構
特征層融合是在遙測參數級實現數據融合,首先在接收終端實現參數提取,再將關鍵參數傳輸到數據處理中心進行融合處理,具有傳輸數據量小,時延短的特點,其融合結構如圖4所示。參數級融合結構更適合于實時的遙測數據處理。

圖4 遙測參數級融合結構
本文以遙測數據級融合結構為基礎,研究遙測數據在數據層實現數據融合的方法。
2原始遙測數據融合方法
原始遙測數據融合的關鍵是各測控站數據的關聯。理論上講,在完成幀同步、時間同步和數據對齊后,各測站子幀數據應該是完全相同的。但是在跟蹤測量飛行器過程中,各測站會受到方位、距離、電磁環境等的影響,使接收的遙測數據疊加有干擾信號。遙測數據融合的實質是判別各測站子幀數據是否一致,即相似性度量,從而將完全相異的數據剔除掉,達到數據選優的目的。為此,筆者采用最近鄰聚類方法實現遙測數據的融合。
2.1最近鄰聚類原理
聚類是對數據對象進行分組,形成多個類或簇,同一個簇中的對象具有較高的相似度,而不同簇中的對象則差別較大。最近鄰聚類算法中的相異度主要是基于描述對象的屬性值來計算,而距離是計算中經常采用的度量方式。
許多聚類算法都是以相異度矩陣為基礎,相異度矩陣是存儲K個對象兩兩之間的鄰近性,表現形式是一個K×K維的矩陣。將遙測數據中的子幀數據看作數據向量對象,則t時刻K個測站子幀數據的相異度矩陣[6-8]可表示為
(1)
式中:dij是測站i和測站j 之間的子幀數據相異性的量化表示,通常它是一個非負的數值。當對象i和j越相似,dij值越接近0;2個對象越不同,其值越大。
最常用的距離度量方法是歐幾里得距離和曼哈坦距離。考慮到計算效率,本文采用曼哈坦距離公式[7-8],計算如下:
(2)
式中:站位編號i,j=1,2,…,K;N為子幀數據長度。
為了減小度量單位的選擇對聚類效果的影響,需要對子幀數據進行標準化處理,使原來的度量值變成無度量單位的值[7]。對子幀數據進行標準化度量,可以作如下變換。
①計算絕對偏差的平均值。
(3)

②計算標準度量值。
(4)
2.2最近鄰聚類的實現
在實際應用中,無需計算相異度矩陣,采用最近鄰算法實現聚類分析。最近鄰聚類是一種最簡單的聚類算法[8-9]。根據此算法,首先把第1個站位子幀數據作為第1組的聚類中心。然后,如果1個站位的子幀數據距該聚類中心的距離d小于某個預期值,就把該站位子幀數據放到此組中,即該組的聚類中心是和這個子幀數據最鄰近;否則,把該子幀數據設為新的聚類中心。詳細的算法如下。



步驟3。令k=k+1,若k≤K,返回步驟2。

2.3融合準則
在飛行器飛行試驗過程中,至少要2個測站同時跟蹤測量相同區段的遙測數據。因此,在全程彈道中始終至少有2個站位的子幀數據相同。根據這一特點,在最近鄰聚類的基礎上,設計如下融合準則。
準則3。上述2個準則失效時,調整聚類半徑。

3仿真測試
以某次試驗5個測站的遙測數據為例,經時碼同步、數據對齊、標準化度量變換后,由式(2)獲得5個測站的遙測子幀數據相異度矩陣:

由相異度矩陣可以看出:測站1、測站2相異度為0,即數據完全相同。測站3、測站4和測站5都受到了不同程度的噪聲干擾。由相異度數值可判斷出測站4、測站5的野值要多于測站3的野值。
根據最近鄰聚類算法,設聚類半徑初始值r=0.1,可以得到聚類分析的結果。
由融合準則1可確定聚類1中存在優選數據,測站1和測站2與聚類中心距離最小,可作為優質數據加以選擇。
將全程遙測數據的融合處理結果與各測站遙測數據的處理結果進行對比,可以發現融合數據的野值明顯減少,孤立野值的剔除率高于95%,而斑點野值的剔除率不低于85%,數據質量明顯改善。實驗表明,基于最近鄰聚類方法進行數據融合能夠有效獲得各測站中的最優子幀數據。
在算法使用中,初始參數r的選擇是算法正確實施的關鍵。r過小,在所有測站都有干擾的情況下,會使聚類的數目與測站的數目相同,即每個測站的子幀數據都形成一個聚類,致使算法失效。在實際處理中出現失效時,將聚類半徑以2倍遞增并重新計算。
4結束語
本文分析了遙測數據處理中數據對接方法存在的問題和弊病,提出了一種新的基于最近鄰聚類分析實現遙測原始遙測數據融合的方法,使遙測數據的對接和整合達到子幀數據級別,實現了更精確的遙測數據處理。試驗數據的測試和檢驗表明,該方法能夠準確地從多測站遙測數據中遴選出最優的子幀數據,為數據處理提供了全彈道高質量遙測數據,提高了處理效率和質量。
參考文獻
[1]劉亞南,陳雷.遙測數據融合軟件的設計與實現[J].現代電子技術,2012,35(4):136-138.
LIU Ya-nan,CHEN Lei.Design and implementation of telemetry data fusion software[J].Modern Electronics Technique,2012,35(4):136-138.(in Chinese)
[2]陳以恩.遙測數據處理[M].北京:國防工業出版社,2002:393-397.
CHEN Yi-en.Telemetry data processing[M].Beijing:National Defense Industry Press,2002:393-397(in Chinese)
[3]何友,王國宏.多傳感器信息融合及應用[M].第二版.北京:電子工業出版社,2007:2-6.
HE You,WANG Guo-hong.Multisensor Information fusion with applications[M].Second Edition.Beijing:Publishing House of Electronics Industry,2007:2-6.(in Chinese)
[4]宮志華,段鵬偉,岳銳.外彈道多源異類測元數據融合仿真分析[J].彈道學報,2014,26(4):19-23.
GONG Zhi-hua,DUAN Peng-wei,YUE Rui.Simulation of data fussion with multi-source heterogeneous measurement elements[J].Journal of Ballistics,2014,26(4):19-23.(in Chinese)
[5]王慧斌,王建穎.信息系統集成與融合技術及其應用[M].北京:國防工業出版社,2005:219-232.
WANG Hui-bin,WANG Jian-ying.Information system integration and fusion technology and its application[M].Beijing:National Defense Industry Press,2005:219-232.(in Chinese)
[6]岳昆.數據工程[M].北京:清華大學出版社,2013:178-204.
YUE Kun.Data engineering[M].Beijing:Tsinghua University Press,2013:178-204.(in Chinese)
[7]戴劍偉,吳照林.數據工程理論與技術[M].北京:國防工業出版社,2010:208-218.
DAI Jian-wei,WU Zhao-lin.Theory and technology of data engineering[M].Beijing:National Defense Industry Press,2010:208-218.(in Chinese)
[8]HAN J,KAMBER M,PEI J.數據挖掘概念與技術[M].第三版.范明,孟小峰,譯.北京:機械工業出版社,2015:44-54.
HAN J,KAMBER M,PEI J.Data mining concepts and techniques[M].Third Edition.FAN Ming,MENG Xiao-feng,translation.Beijing:China Machine Press,2015:44-54.(in Chinese)
[9]王立新.模糊系統與模糊控制教程[M].北京:清華大學出版社,2003:134-164.
WANG Li-xin.A course in fuzzy system & control[M].Beijing:Tsinghua University Press,2003:134-164.(in Chinese)
A Multi-station Telemetry Data Fusion Method Based on the Nearest-neighbor Clustering Analysis
ZHU Xue-feng
(Unit 92941 of PLA,Huludao 125000,China)
Abstract:To study the multi-station telemetry data automated-docking method to provide the high-quality whole-ballistic telemetry data,the multi-sensor information fusion technology was used,and the target recognition level multi-station telemetry data-fusion was realized by adopting nearest-neighbor clustering algorithm.Taking the telemetry data of five stations in an experiment for instance,the simulation was carried out.The tests show that the optimal telemetry data frame can be effectively selected from multiple stations by this method.The multi-station telemetry data fusion can be achieved by the integration and restructuring,and the abnormal tracking telemetry data is effectively eliminated,and the efficiency of data processing and quality can be improved.
Key words:telemetry data;cluster analysis;nearest-neighbor algorithm;data fusion
收稿日期:2015-07-08
作者簡介:朱學鋒(1969- ),男,高級工程師,工程碩士,研究方向為試驗數據工程及遙測數據處理。E-mail:18042909136@163.com。
中圖分類號:V557
文獻標識碼:A
文章編號:1004-499X(2016)02-0093-04