王 茜,仲 超,楊 雷
(1.空軍勤務學院,江蘇 徐州 221000;2.駐中國空空導彈研究院軍事代表室,河南 洛陽 471000)
數據預處理[1]是數據測試的重要環節,對數據進行預處理能確保數據的無差異性和非偶然性。一般數據的預處理包括標度變換、數字濾波、剔除奇異項、剔除趨勢項和平滑處理。在部隊,導彈測試數據的預處理在導彈測試中占據重要地位,其預處理主要包括量綱消除、剔除奇異項和剔除差異項,預處理后的數據經D9接口輸入計算機,進行下一步處理。
國內外研究學者針對數據預處理這一課題有較深入的研究,Fayyad U在其著作《Advances in Knowledge Discovery and Data Mining》中講明數據變換的聚集過程,提出幾種聚集方法。GJ.Williams在其著作《Modeling the KDD Process》中指出數據預處理是KDD的重要組成,并詳細闡述了數據清洗問題。我國專家劉乃琦在其著作《IBM-PC混合語言編程技術》中根據數據預處理過程提出幾個編程方法并給出實例。本文依據國內外研究成果,針對某型導彈的測試流程,設計數據預處理模塊,完成其測試數據的預處理工作。
導彈數據的測試存在偶然性,一般測試時,某些參數會多次測量。參數包括電壓、電流、時間和頻率等復雜類別,每個參數對應的一組測量值也可能存在奇異項和趨勢項[2]。
針對這些情況,需先對參數進行無量綱化,然后剔除參數中的奇異項和趨勢項,最終取剔除后每組數據的平均值作為對應參數的實測值。
本文使用Multisim14設計預處理模塊電路,使用Matlab調試預處理程序,調試合格后可經emlc命令轉化為C語言后燒入單片機,實現對數據的預處理,本文主要根據原理分析和設計電路,對預處理效果進行仿真。
從導彈傳入的信號一般在10-3數量級,單片機無法識別,因此,需要對信號放大,信號放大電路如圖1所示。

圖1 信號放大電路
圖中V1和V2是差動放大器[3]同相輸入端,V3是差動跟隨器輸出端,其增益近似為1。差動放大器放大倍數如式(1)所示

差動放大器使用3288RT,此型號放大器漂移小、輸入阻抗高、共模抑制比高,適合微小信號輸出時使用,還可用作電壓比較器,功能較為強大。
模擬信號輸入后需經A/D轉換器,然后輸入單片機中,A/D轉換器外部連接電路連接如圖2所示。
IN為數據輸入端,A/D轉換器D0~D7引腳經總線輸入至單片機中,外接的3個與門與內置轉換電路實現模數轉換功能,ADDA、ADDB和ADDC是模數轉換區引腳,一般接地。

圖2 A/D轉換器外部連接電路
采集參數主要為電壓和電流信號,電壓和電流數據需要進行量綱變換,將有量綱量轉化為無量綱量,這里采用Z標準化[4]的方法,量綱消除公式為

而后得到一個參數的多個無量綱采樣值,采樣數據中可能存在奇異項和趨勢項。先對奇異項進行剔除,根據奇異項判斷準則,預測值xt′用差分方程計算。

誤差限W根據采集系統特征確定。檢測出奇異項后,用預測值代替,若有連續兩個或以上奇異點出現,則先判斷是否滿足式(4)

經驗證明,K值一般取5,若滿足式(3),則不剔除,若滿足式(5)

則繼續用xt′取代xt,即認為該點必是干擾點。一般采用肖維勒方法剔除奇異項,肖維勒系數可按如下近似公式計算:

如果測量值與平均值之差絕對值大于標準偏差與肖維勒系數[5-6]之積,則該測量值被剔除,即

趨勢項的剔除方法為最小二乘法[7],尋找函數,使得與x(t)的誤差平方和最小,采樣數據為離散化數據,令采樣間隔Ts=1,則擬合數據多項式為

誤差平方和E(b)的表達式為

因為 bm(1≤m≤M)總為正數,所以 E(b)對 bl求偏導,使其為零,即

式(10)可產生M+1個如下方程

根據N個待處理的xk,可得到(M+1)個bm值,式(9)實際是(M+1)元線性方程組。根據經驗,一般M的值在3以內,當M為1時,由式(9)可得以下聯立方程組

再聯合下式

最終解式(9)可得

由于導彈某些參數測試時需進行多次測量,因此,某些參數對應的的初始值并不是一個單值,而是一組數。這組數若存在奇異項和趨勢項,則需剔除并替換。
以該型導彈引信起爆需要的多個多普勒脈沖為例,采樣值為 1.503 4、1.506 2、1.503 4、1.502 4、1.498 5、2.500 0、1.500 7、1.506 7、1.499 3、1.496 9。其中2.500 0為奇異項,此項數據保存在“參數n.dat”文件中。程序調試可得如圖3所示結果。
圖3中2.500 0項已被剔除,由于采樣數據較多,奇異項較少,數據不替換不會對最終結果造成影響,因此,這里不進行數據替換。

圖3 奇異項剔除結果
以該型導彈陀螺轉子不通電轉速下降值為例,在1 000 ms的時間內對轉子的頻率進行測量,對測量值進行曲線繪制,并描述其中趨勢項和總曲線,然后對趨勢項進行剔除,剔除結果如圖4所示:

圖4 趨勢項剔除結果
這里為方便觀測,轉子頻率設為不變,表現為如圖所示的正弦波。趨勢項設為時刻變化的連續值,表現為如圖的曲線。對兩者的混合信號進行處理,剔除趨勢項。
本文通過對某型導彈測試流程的分析,依據現階段研究情況,參考部分文獻,設計具備預處理功能的模塊,以滿足我軍在該型導彈測試上的需要。現階段我軍測試技術還有不足之處,未來在數據預處理領域會融入更多如大數據處理技術等高新技術。