李曉晴, 劉 瀛, 包素艷
(1.北京交通大學 機械與電子控制工程學院,北京 100044; 2.航天新長征大道科技有限公司,北京 100070;3.北京航天愛銳科技有限責任公司,北京 100076)
導彈是一種“長期貯存,一次使用”的武器裝備,其健康狀態通常需要綜合多個參數進行評定,一旦某一關鍵部位出現故障,將會給整個系統帶來嚴重影響,后果不堪設想。但是測試參數與導彈健康狀態之間并不存在明顯的對應關系,所以利用測試參數評估導彈健康狀態是一個不確定性推理過程,D-S(Dempster-Shafer)證據理論可以很好地處理基于多源信息不確定推理的問題,對于發現潛在故障和優化決策等方面具有重要作用。本文針對經典D-S證據理論在數據融合過程中存在的問題[1],通過對比現有的改進算法,并在此基礎上做了進一步修正,最后用一個實際案例證明了該算法的有效性。
D-S證據理論起源于20世紀60年代,最早是由美國的數學教授Dempster提出來的,該理論利用上下限概率完美地解決了多值映射的問題,后來Shafer對該理論做了進一步完善并進行了推廣[2]。經典的D-S證據理論主要包括3個基本內容:基本可信度分配函數m、信度函數Bel和Dempster合成規則。
(1) 基本可信度分配函數。

(2) 信度函數。
Dempster合成規則是證據理論的核心,其將來自不同信息源的獨立證據進行組合,產生更可靠的信息。假設Bel1和Bel2是同一識別框架上的兩個可信度函數,m1和m2分別是其對應的基本可信度分配函數,則Dempster合成規則可以表示為
(1)

但是當K→1時,即證據之間的沖突程度較大時,經典的D-S證據理論不再適用。實際上,在評估導彈健康狀態時,各項測試參數大多通過傳感器采集,而傳感器采集的信息不乏相互沖突矛盾的,如果直接帶入模型,則會導致結果分析不準確,需要對D-S證據理論進行改進。
針對D-S證據理論不能合成高沖突證據的問題,主要有以下兩種改進方法。
(1) 修改證據源。
該方法的前提是認為D-S組合規則本身沒有問題,但是需要對原始證據進行處理。Murphy最早提出了加權平均法[3],首先求出所有證據的基本概率分配(Basic Probability Assignment,BPA)的算術平均值,然后再利用經典的D-S證據組合規則進行n-1次融合,通過對證據進行簡單的加權處理可以提高沖突證據融合結果的精確性,彌補了經典證據理論組合規則的不足之處[2]。但是該方法在進行加權處理時,默認各個證據對結果的影響是相同的,但實際上各個參數指標所占的權重并不相同,所以Murphy方法還需進一步改進。鄧勇等[4]在Murphy改進方法的基礎上,引入了一個度量各個證據體之間相似度的距離函數,可以計算出系統中各個證據相對于其他證據的支持度,并將該支持度作為權重,進行加權平均后利用D-S組合規則進行融合,該方法具有較強的抗干擾能力,收斂速度也較快。胡昌華等[5]通過Pignistic變換重新定義了衡量證據間沖突的標準,通過引入證據重要權重系數,對沖突概率進行重新分配,也可以有效處理證據之間的沖突。雖然上述幾種方法中都考慮了各個證據體之間的關系,可以在一定程度上改善沖突問題,但是并沒有考慮證據自身的有效性,對最終的融合結果也會產生一定影響。
(2) 修改合成規則。
該方法的前提是認為最終融合結果與實際不符是由于組合規則的不足引起的。最具有代表性的則是Yager[6]法,他認為應該將沖突證據賦給辨識框架中的未知部分。雖然這樣處理在一定程度上可以合成高沖突的證據,但是相當于完全否定了沖突證據,當有2個及以上的證據源時,該方法的合成效果并不理想。孫全等[7]則認為即使證據間互相沖突但是仍有部分是可用的,可用程度取決于該證據的可信度,可以把支持證據沖突的概率賦給各個命題,但是這種方法的一個明顯錯誤在于作者在求解時把證據集體的可信度當做單個證據的可信度。李弼程等[8]則在孫全的基礎上,將支持證據沖突的概率按各個命題的平均支持程度進行加權分配,進一步改進了組合規則,即使對于高沖突證據,也可以得到較為理想的結果。李弼程改進的方法雖然使融合結果更符合實際,但是忽略了各個證據的可信度。葉清等[9]在李弼程改進方法的基礎上引入了“證據折扣率”用來確定各個證據的權重,將沖突按照證據權重進行分配。潘光等[10]則在此基礎上對D-S組合規則做了進一步改進,通過證據距離確定單個證據的可信度,基于可信度采用加權平均的方法將證據沖突概率分配給各個命題,這兩種改進方法都加快了融合結果向正確目標收斂的速度。
綜上所述,對比經典D-S證據理論以及兩種主流的改進算法,不難發現,大多數學者都將重心放在了分析證據之間的關系上,但是證據本身的有效性和重要程度卻被忽略了。且經大多數文獻結果證明,修改證據源要比修改合成規則在解決沖突問題上更有效[11]。Haenni[12]從工程、哲學和數學的角度證明了“如果在模型X上使用方法Y得出了一個不合理的結論Z”時,實際上應該是模型X的問題,應該修正的是模型本身,即證據源本身,而不是修改合成規則。
目前,已有不少學者將改進的D-S證據理論應用在導彈的健康狀態評估中,改進方法也大多借鑒以上兩種主流方法。文獻[1]中綜合考慮平均概率和證據理論,構造了一種新的D-S證據組合規則,采用平均概率合成沖突證據,用于評估導彈控制系統的完好性,但是在證據合成時并沒有考慮證據之間的關系。文獻[13]中建立了基于改進證據理論的裝備健康狀態退化模型,在D-S證據合成規則中加入了基本概率賦值的“折扣率”,但其選用的三角型隸屬度函數過于粗糙,不能很好地表征測試數據與健康狀態之間的關系;文獻[14]中利用粗糙集結合修正證據源的D-S證據理論建立了導彈故障智能診斷推理模型,雖然能夠減少不確定性對導彈故障智能診斷的不利影響,但是計算量較大,復雜度較高。
所以本文從實際工程問題出發,基于修正證據源的改進方法,在文獻[4]的基礎上,對證據源進行處理,計算各個證據的權重,并對證據的可信度進行修正,提出了一種新的基于D-S證據理論評估導彈健康狀態的方法。
本方法的核心思想是在利用D-S組合規則進行融合之前,首先對各個證據進行處理,從已有的數據中分析各個證據之間的聯系以及證據自身的有效性和可靠性,從而確定每個證據的最終權重。一方面,根據香農定理,一個證據自身包含的不確定信息越多,對決策的影響應該越小,權重就越低;另一方面,如果一個測試指標的實際測量值即將超過標準閾值,即導彈的健康狀態將由擬故障過渡到故障,則在決策時應該重點突出狀態較差的參數,使決策結果向故障狀態傾斜,提醒用戶重點關注該導彈。在此基礎上,本文改進的基于D-S證據理論評估導彈健康狀態的方案具體步驟如下。
① 根據同一時間不同導彈相同指標的測量值,利用熵權法計算出各個指標的權重向量W1。信息熵的定義如下:
(2)
式中:p(xi)表示隨機事件X為xi的概率。
熵權法主要根據指標的變異性的大小來確定指標的客觀權重。通常來說,如果某個指標的信息熵越小,說明該指標的變異程度越大,提供的信息量越大,在綜合評價中所占的權重就越大。假設有n個指標,利用熵權法求得的第i個指標的權重為W1i。
② 以一枚導彈作為分析對象,如果有某個指標的測量值超出指標閾值范圍,即判定該導彈為故障狀態;若所有測試參數均在標準閾值范圍內,則進一步分析其所處的健康狀態。
③ 首先根據各個測試指標的歷史測試均值,上次非故障值和標準值對測試參數進行歸一化處理,最后取平均值作為最終歸一化值λ;然后按照最終歸一化值求權重向量W2,歸一化值越大,權重越大,目的是突出狀態較差的參數,權重計算方法如下所示,則第i個參數對應的權重為W2i。
(3)
④ 根據測試參數的歸一化值,利用合適的嶺形隸屬度函數,求出各個指標相對于各個健康狀態等級的隸屬度,即D-S證據理論中的BPA。
隸屬度函數用于表示導彈處于某種健康狀態的程度高低,取值范圍為[0,1],隸屬度越接近于1,隸屬程度越高,反之越低[15]。傳統的三角隸屬度函數過于粗糙,由于嶺形分布隸屬度函數具有主值區間較寬、過渡帶平緩等特征,具有良好的對稱性、穩定性和控制敏感度,可以較好地表征各個健康狀態之間的不確定關系[16],所以選用嶺形分布隸屬度函數對相鄰健康狀態等級之間的不確定性進行量化分析。嶺形隸屬度分布函數如下所示:
(4)
⑤ 利用Jousselme距離[17]求出各個證據(指標)之間的距離,進而求出每個證據的可信度。Jousselme距離是Jousselme為了衡量兩個證據之間的相似性提出的一個距離函數。假設m1和m2是辨識框架Θ中的兩個BPA函數,將m1和m2視為行向量,則m1和m2之間的距離可以表示為
(5)

(6)
式中:
(7)
‖m‖2=〈m,m〉
(8)
根據證據mi和mj之間的距離可以計算兩者之間的相似度S(mi,mj)為
S(mi,mj)=1-dBPA(mi,mj)
(9)
兩者之間的距離越小,相似性越高。依此類推,對于系統中的任意一個證據mi,可以求得該證據與系統中其他證據的相似度,進而求得該證據與其他證據的平均相似度為
(10)
平均相似度越高,說明該證據與其他證據的距離越近,獲得其他證據的支持度越高。根據系統中所有證據的平均相似度,可以計算出每個證據的可信度為
(11)
證據的可信度越高,其在決策過程中所占的權重越大。
⑥ 綜合步驟①和步驟③中求得的各個證據的權重W1i以及權重W2i對證據的可信度Ri進行修正。假設有n個證據,則第i個證據的權重為
(12)
⑦ 基于Murphy改進方法,在BPA中加入各個證據的權重,利用D-S組合規則進行n-1次融合,得出最終結果,該方法的計算過程如下:
(13)
綜上所述,在導彈健康狀態評估中,首先在性能指標測試參數的基礎上,對單位不一、閾值各異的測試參數進行歸一化處理;接著根據參數的歸一化值和不確定性求出該參數的綜合權重;然后利用Jousselme距離求出該證據的可信度,并對該證據的權重進行修正;最后通過改進的嶺形隸屬度函數確定各個參數對各個健康狀態等級的隸屬度,即該證據的BPA值,構建基于改進的D-S證據理論的導彈健康狀態評估模型。流程圖如圖1所示。

圖1 導彈健康狀態評估流程圖
健康狀態分級是導彈健康狀態評估的基礎,傳統的導彈健康狀態分級采用的“是非制”過于粗糙,不能準確掌握導彈當前的健康狀態,本文將導彈的健康狀態根據參數測量值的范圍進一步細化,如表1所示。

表1 健康狀態分級
以某型號地空導彈為例,假設表征其健康狀態的測試指標為P1、P2、P3、P4、P5,在2020年的某次測試中,10枚導彈各個測試指標的測試情況如表2所示。

表2 10枚導彈測試參數列表
如果出現某個測試參數的實際測量值超出標準閾值范圍,則該設備的健康狀態直接被判定為故障狀態。已知表2中各個測試參數均在標準閾值范圍內,利用熵權法可以得到各個測試參數指標在設備健康狀態評估中的權重向量為W1=[0.2171,0.202,0.2184,0.2184,0.1442]。
以其中一枚導彈為例,5個測試參數對應的本次測試實際值、上次測試非故障值、歷史測試均值以及標準閾值如表3所示。

表3 單枚導彈測試參數列表
考慮到導彈的健康狀態是一個隨時間累積的過程,不僅與現在的參數有關,還與設備的歷史測試數據有關,在進行歸一化處理時,將本次測試數據與上次非故障測試數據、歷史故障數據均值以及標準數據分別進行比較,可以更準確地描述當前的健康狀態。經過歸一化處理之后,最終歸一化值為λ=[0.4417,0.4139,0.4033,0.3822,0.3295]。為了突出狀態較差的參數,得到各個參數的權重向量W2=[0.2241,0.21,0.2047,0.194,0.1672],改進的嶺形隸屬度分配函數如圖2所示,其中顏色重疊區域代表不確定性區域,處在該區域的歸一化值,既隸屬于前一狀態,又隸屬于后一狀態,隸度和為1。

圖2 嶺形分布隸屬度函數示意圖
利用最終歸一化值,根據隸屬度分布函數,可以求出各個證據(指標)對應的BPA,假設優秀、良好、較好和擬故障對應的質量等級分別為A、B、C、D,測試參數P1、P2、P3、P4、P5對應的BPA為m1、m2、m3、m4、m5,具體數值如表4所示。

表4 基本概率分配(無沖突)
根據Jousselme距離可以求出這5個證據指標的可信度分別為:R1=0.2013,R2=0.2094,R3=0.2083,R4=0.2096,R5=0.1714。根據權重W1和W2對可信度進行修正,可以得到5個證據指標的最終權重分別為:ω1=0.2142,ω2=0.2071,ω3=0.2105,ω4=0.2073,ω5=0.1609。
下面將本文提出的方法與D-S經典理論、Murphy法改進算法以及文獻[4]算法進行對比,融合結果如表5所示。

表5 算法融合結果對比(無沖突)
由表5可知,在獲取的信息源中沒有沖突或沖突較小的情況下,4種方法的最終合成結果相同。對比相同迭代次數下,本文的改進方法相比于Murphy改進算法和文獻[4]中的方法收斂速度更快,這是因為在融合過程中,根據各個指標的測試值對證據的可信度做了進一步修正,加快了向正確結果的收斂速度,也進一步論證了本文改進算法的正確性。
如果修改表3中的P1本次測試值為0.69,即超出閾值范圍,使測試信息中存在一定程度的沖突。經計算,最終歸一化值為:λ=[0.6417,0.4139,0.4033,0.3822,0.3295],根據歸一化值進一步求得各個參數權重:W2=[0.2965,0.1907,0.1858,0.1761,0.1518],根據嶺形隸屬度函數可以求得各個證據對應的BPA如表6所示。

表6 基本概率分配(有沖突)
由表6可知,證據1(m1)提供的信息與其他4個證據提供的信息存在嚴重沖突。根據Jousselme距離可以求出這5個證據指標的可信度為:R1=0.0297,R2=0.2522,R3=0.2505,R4=0.2525,R5=0.2151。根據權重W1和W2對可信度進行修正,可以得到5個指標的最終權重分別為:ω1=0.1507,ω2=0.2214,ω3=0.2245,ω4=0.2216,ω5=0.1755。
D-S經典理論算法中,由于上述信息中證據1與其他證據產生明顯沖突,沖突因子K=1,此時經典的證據理論合成規則不再適用。對比沖突證據1的權重,Murphy算法中的權重為0.2,默認與其他證據權重相同;文獻[4]算法中的權重為0.0297,認為其作為沖突證據,可提供信息較少,所占權重也最??;本文改進算法在文獻[4]的基礎上,對沖突證據的權重做了進一步修正,最終權重為0.1570。下面比較Murphy改進算法、文獻[4]算法以及本文算法在解決合成信息存在沖突時的合成結果,如表7所示。

表7 算法融合結果對比(有沖突)
由表7可知,3種方法的最終融合結果均表示該導彈處于良好狀態,說明該方法同樣適用于處理存在沖突信息的情況。由于原始信息中存在沖突證據,參數1的實際測量值即將超出標準閾值范圍,雖然導彈整體健康狀態趨于良好,但是如果某個測試指標存在異常,在進行合成時,應盡量保留該信息,確保合成結果的真實有效,則文獻[4]的合成結果與實際情況存在一定偏差。Murphy方法和本文改進方法的合成結果均保存了該信息,由于Murphy方法默認各個證據的權重相等,雖然計算簡單,但是卻忽略了證據自身的有效性和證據體之間的聯系;本文的改進方法不僅保留了證據自身的信息,且結合了證據之間的關系確定了最終權重,聚焦速度比Murphy改進算法更快,與此同時又保留了處于較好狀態的小概率,用戶可以根據評估結果合理安排維修保養任務,及時排除安全隱患[13],確保整個設備系統正常運行。
綜上所述,當融合信息中存在一定程度的沖突時,不能盲目全盤否定沖突信息,即沖突證據也可以提供一部分有效信息,且該證據所占的權重與其他證據相比較大,目的是凸顯狀態較差的參數,使最終融合結果既不會產生明顯的偏移,同時又保留沖突證據所提供的信息。
導彈的健康狀態評估是制定維護與管理任務的先決條件,本文改進的算法可以對各個測試指標進行綜合評估,給出相對客觀的權重,由于各種因素的干擾,獲取的信息源中有時會有沖突證據存在,在利用D-S證據理論進行融合時,不能全部否定沖突信息,要從證據自身出發,結合各個證據自身的有效性和可靠性對證據的可信度做進一步修正。經論證,提出的改進算法的融合結果與實際情況相符,且向正確結果收斂的速度要優于Murphy改進算法和文獻[4]中的改進算法,對于導彈健康狀態的評估更加細化,對D-S證據理論在導彈以及其他飛行器中健康評估的應用具有一定的參考價值。