蔣 偉,王 挺,盛 文,魯 力
(空軍預警學院 防空預警裝備系, 武漢 430019)
T/R組件作為相控陣雷達的重要組成部分,主要擔負通過雷達天線向外輻射能量,并接收目標的回波信號,同時依靠環行器、移相器、衰減器等輔助電路實現發射信號和接收信號在空中合成的作用[1-3],隨著T/R組件的集成度越來越高,其故障率也隨之增長。相控陣雷達T/R組件數量龐大,少則幾百,多則上千上萬。
相控陣雷達T/R組件的結構比較復雜,對使用條件的要求也非常高,因此對后續的使用保障和維修工作提出了更高的要求。為了對后續的使用保障提供理論依據,需要對T/R組件的可靠性進行分析研究,得到T/R組件運行時間和可靠度之間的關系。在可靠性分析中,壽命分布建模是一種常用的數學方法[4],目前在判斷一組可靠性數據的分布類型方面,主要有以下幾種方法:1.最小誤差法[5],即選取幾個通常可能的分布類型,然后用可靠性數據分別進行擬合,當中誤差最小的就是所求的分布類型;2.圖形法[6],即將可靠性數據映射到圖形中,若該數據與某一特定分布數據圖形相一致,則該分布為所求的分布類型;3.智能識別方法,當前壽命分布的智能識別算法很多,比如文獻[7]提出一種智能復合結構,能夠對常見的幾種壽命分布進行識別,且識別率達到90%以上;文獻[8]提出了一種基于最大隸屬優勢準則的變量汞壽命分布識別方法,具有較高的可信度;文獻[9]利用BP神經網絡對可靠性數據進行壽命分布識別,文獻[10]利用經典分布擬合法、最大熵值法、多項式逼近法和正態信息擴散法對巖土參數的概率分布進行推斷,但上述方法中,最小誤差法和圖形法可能出現有多個分布同時滿足要求的情況和BP神經網絡收斂速度慢等問題。因此本文首先根據可靠性數據的特點,對其樣本的峰度、偏度、累積概率、分位數等特征進行提取,然后利用核主成分分析法對數據特征進行降維,并構造了可靠性數據概率分布特征的訓練樣本,最后運用多分類支持向量機模型對數據的概率分布進行模式識別。
根據壽命分布數據的特點可知,其統計特征主要包括:極差、標準偏差、變異系數、算數平均值、中位數、眾數、峰度、偏度、累積概率。在對T/R組件壽命分布樣本進行構建時,根據文獻[9]以及通過反復研究試驗,結果表明當選取峰度、偏度、變異系數、累積概率、中位數作為樣本的主要特征進行提取時,能夠得到更好的分類效果,因此本文選取峰度、偏度、變異系數、累積概率、中位數作為數據樣本的特征。
在對T/R組件壽命分布數據進行識別時,首先要對其可能的分布模式進行選取,根據T/R組件所屬的器件類型為電子器件,且根據工程實際情況,選取指數分布、正態分布、威布爾分布、對數正態分布四種分布類型為可能的分布模式類別。

1) 從可靠性數據中獲取數據特征信息,將其表示為m×n矩陣,其中m為樣本組數,n為特征屬性個數。
(1)
2) 選取合適的核函數,并計算核矩陣K,本文在建模時選取徑向基(RBF)核函數:
(2)
式中:xi,xj為輸入空間的樣本,δ1為核參數。
3) 對核矩陣K進行修正,得到矩陣Kp,計算矩陣Kp的特征值V和特征向量D。
4) 將特征值按降序排列,同時調整對應的特征向量。
5) 計算特征值的累積貢獻率Rc,并給定最小提取閾值,提取t個主元分量α1,α2,…,αt。
6) 計算在提取的特征向量上的投影,Y=Kp·α,其中α=α1,α2,…,αt,Y即為所得的降維后的數據。
支持向量機在解決小樣本、非線性及高維模式識別中表現出許多特有的優勢[14-16]。
二分類支持向量機的基本思想為:首先通過非線性變換將輸入變量空間映射到一個高維空間,然后在這個高維空間中求取最優線性分類面,最優分類線的選取原則為不但能將兩種類別無錯誤分類,而且要使兩種類別的分類間隙最大,最優分類線如圖1所示。
圖1中,○和▲分別為兩類樣本,H為把兩類樣本無錯誤分開的最優分類線,H1和H2分別為經過各類樣本且離最優分類線最近的平行于最優分類線的直線,H1和H2之間的距離稱為分類間隙,將圖1推廣到高維度空間,最優分類線就變為最優分類面。
支持向量機其實為一個二類分類器,但為了能夠實現對多種類型進行分類,主要方法就是訓練多個二分類器,當前多分類實現方式主要有以下兩種方法:1).一對多,即對于給定的m個類別,需要訓練m個分類器,其中分類器i是將i類數據設置為類1(正類),其他所有m-1個i類以外的類共同設置為類2(負類),因此對于每一類都要訓練一個二分類器,最后總共需要m個二分類器。對于一個即將要進行分類的數據X,用分類器i對數據進行分類,如果獲得的是正類結果,就說明數據X屬于i類,如果獲得的是負類結果,則說明數據X不屬于i類,如此反復最終得到數據X的類別屬性。2).多對多,即對于給定的m個類別,對m個類別中的每兩個類都訓練一個分類器,總共二分類器的個數為m(m-1)/2。對于數據X,它需要經過所有分類器的識別,最終確定所屬的類別,該方法與“一對多”方法相比,需要的分類器較多。本文利用Matlab軟件中的libsvm工具包,選用多對多方法進行分類,并利用網格搜索的方法確定錯分懲罰因子gam和徑向基核函數的參數δ2。
根據上述核主成分降維分析方法以及多分類支持向量機模型可建立一套完整的T/R組件壽命分布識別流程,具體的流程為:
1) 確定初始訓練樣本集。根據1.2節所選取的四種分布類型,并選定四種分布參數,利用Matlab軟件,產生四種分布的隨機數,求出每組隨機數的數據特征,并進行歸一化處理,將處理后的數據作為初始訓練樣本集;
2) 利用核主元分析法進行降維處理。通過建立的核主元模型對初始訓練樣本集進行主元特征降維處理,設置累積貢獻率為0.95,當累積貢獻率到達0.95時,確定主元特征數量,并把輸出的特征向量作為后續支持向量機模型的訓練樣本;
3) 多分類支持向量機的參數設置及樣本訓練。設置SVM模型中的初始參數,然后將四種類型分布的隨機數經過特征提取和降維后,分為訓練樣本和測試樣本輸入到模型中,判斷識別率β是否達到要求,若未達到則修改模型初始參數,直到識別率滿足要求為止;
4) 實例仿真識別。對T/R組件的壽命數據進行特征選取,并經主成分分析法提取主元特征,構成待識別壽命分布樣本;
5) 驗證識別結果的正確性。與傳統假設檢驗識別方法進行比較,驗證所建立模型的正確性。
具體流程圖如圖2。
在對T/R組件壽命分布數據進行識別時,1.2節已經選取了指數分布、正態分布、威布爾分布、對數正態分布四種分布類型為可能的分布類型,為了更好地分析四種概率分布的形狀及細節特點,本文對四種分布的具體參數細分,得到了100種分布模式,如表1所示。

表1 100組分布模式
利用Matlab仿真軟件產生上述100組分布模式的100個隨機數,然后求出每組隨機數的數據特征:峰度、偏度、變異系數、累積概率、中位數,將處理后的數據作為初始訓練樣本集,部分初始訓練樣本集如表2所示。

表2 部分初始訓練樣本集
根據上述第2節中所建立的主元分析法步驟,對初始訓練樣本數據(100×10維矩陣)進行主元特征提取,核函數選擇徑向基核函數,經過仿真試驗,本文δ1取值為100時,前4個核主元的方差累積貢獻率達到97.17%,如圖3所示。因此主元個數選取為4個,然后將初始訓練樣本在主元方向上對應的特征向量作為后續多分類支持向量機模型的輸入量。
本文按照3.2節多分類支持向量機的實現算法編寫Matlab程序,構建了多分類支持向量機壽命分布識別模型,其中對錯分樣本懲罰程度的可調參數gam和徑向基核函數的參數δ采用網格搜索的方法確定具體取值為gam=5.656 9,δ2=16,設置樣本分類數為4類。本文在對模型進行訓練時,將100組數據樣本進行主元特征提取,然后將提取后的主元特征向量作為多分類支持向量機的訓練樣本,其中20組數據作為測試樣本,測試樣本的識別率達到95%,所建立的多分類支持向量機模型對測試樣本的具體識別結果如圖4所示。
為了說明核主元降維分析法的作用,將100組未經過核主元分析法的測試樣本輸入到多分類支持向量機模型,測試樣本的識別率達到100%,具體識別結果如圖5所示。
圖4為經過核主元降維后的測試樣本識別結果,圖5為未經過核主元降維后的測試樣本識別結果,雖然兩者的識別精度有略微差別,但總體識別精度都在95%以上。經過核主元降維后的樣本數據降低到4維,輸入到多分類支持向量機模型中大大減少了運算時間。上述仿真結果表明,利用核主元分析法可以對訓練樣本數據進行降維,對后續多分類支持向量機模型識別方面大大降低了運算時間,因此在保證一定識別精度的前提下(識別精度在90%以上),經過核主元分析降維方法能夠降低運算時間,相比于未經過核主元降維的方法,更具優越性。
本文對100組T/R組件進行壽命試驗,對該100組T/R組件的首次失效時間進行記錄,記錄的失效時間依次為:13 524 h、23 722 h、2 938 h、5 036 h、8 062 h、5 597 h、11 882 h、3 330 h、6 079 h、5 356 h、57 h、6330 h、21 381 h、1 504 h、436 h、11 995 h、2 734 h、1 855 h、4 284 h、13 647 h、1 910 h、903 h、829 h、6 539 h、14 162 h、2 120 h、1 041 h、2 458 h、3 037 h、7 515 h、9 284 h、1 632 h、2 412 h、3 624 h、3 590 h、4 248 h、1 822 h、13 985 h、3 675 h、2 097 h、6 786 h、4 715 h、5 485 h、1185 h、1 351 h、1 795 h、2 366 h、4 219 h、9 074 h、8 010 h、1 817 h、660 h、3 625 h、7 836 h、385 h、4 054 h、2 920 h、7 737 h、542 h、4 906 h、4822 h、5 213 h、7 175 h、8 495 h、2 560 h、6 487 h、262 h、2 267 h、4 322 h、6 044 h、14 717 h、379 h、4 052 h、2 684 h、179 h、9 564 h、12 179 h、333 h、582 h、238 h、5 138 h、587 h、3 381 h、3 693 h、854 h、6 172 h、4 335 h、17 538 h、5 894 h、776 h、4 543 h、7 507 h、4 195 h、486 h、268 h、6 684 h、9 932 h、353 h、22 316 h、10 523 h。利用Matlab軟件計算出該組數據的10個數據特征分別為1.764 8、7.921 8、0.954、1 473.8、2 277.6、3 405.2、4 565.3、6 070.2、8 476、10 815。然后對該10個數據特征進行核主元分析,將核主元降維后的數據輸入到多分類支持向量機模型,得到最終的分類結果符合指數分布。
利用極大似然估計法對T/R組件的壽命分布數據進行參數估計,置信度設置為95%,求出不同假設分布的參數,并用k-s檢驗方法進行檢驗,具體結果如表3所示。

表3 分布參數擬合和k-s檢驗
分析表3的結果可知,利用極大似然估計和k-s檢驗統計法得到的最終壽命分布結果和本文建立的核主元降維-多分類支持向量機模型的分布識別結果一致,驗證了模型的正確性。由于傳統的極大似然估計和k-s檢驗統計法在對壽命分布進行識別時,有可能出現多種分布同時滿足要求,這就需要進一步細分,增加了復雜程度,而本文建立的核主元降維-多分類支持向量機模型能夠在保證一定識別精度條件下,最大限度降低運算速度,降低模型復雜程度。
與傳統極大似然估計和k-s檢驗統計法相比,本文所采用的核主元降維-多分類支持向量機模型分類精度高,能夠降低模型的運算速度,更具優勢性。