陳元超
(中國空空導彈研究院,河南 洛陽 471009)
證據理論由Dempster于1967年研究上下概率問題時首先提出,后由其學生Shafer將信任函數概念引入而正式形成[1]。證據理論作為一種多源信息融合方法,有著堅實的數學基礎,是不確定性推理方法的一種[2-3]。證據理論通過對不完整性、不確定性問題的數學建模,為多傳感器信息融合提供了一個很好的方向。
證據理論由于其優越的特性被應用到軍事信息融合系統中,然而由于復雜的自然環境和人為干擾,某些探測傳感器得到的信息被干擾而與其它傳感器產生沖突。對于高度沖突的證據信息,經典的證據理論融合會產生有悖常理的結果,很難正確對目標進行識別。對于這一問題,很多學者進行了研究,提出了多種解決方法[4-9],但在某種程度上存在精度低、收斂效率低的問題。
針對證據沖突的融合問題,本文結合Jousselme距離[10]和Pignistic概率距離[11]的優點提出了優化的證據沖突融合方法。
在同一識別框架Θ下,設來自兩個證據源的基本概率分配函數m1和m2,對于?A?Θ,命題A的信任函數通過證據體m1和m2的正交和得到,其合成規則為[12]:
m(A)=m1(A)⊕m2(A)=
(1)
式(1)中,A1,A2為命題A的子命題;k為經典沖突系數,表達式為:
(2)
而(1-k)-1被稱為歸一化因子。對于在識別框架Θ下,如果對于命題A存在多個證據體m1,m2,…,mn時,它們合成過程可以通過兩個證據體時的前兩項的情況進行推導,合成規則如式(3):
m2(A2)×…×mn(An),A≠Φ
(3)
沖突系數k表達式為:
(4)
它用來表示證據間的沖突情況。
證據理論在實際應用中,對于來自多源的證據體,當證據體之間存在明顯的沖突時,經典證據理論所融合的結果往往得出錯誤的結果。對于證據沖突問題,現舉一例進行詳細說明。
例1 對于一個假定的識別框架Θ=(A,B,C),來自兩個證據源的證據體,
證據體m1:
m1[A]=0.99,m1[B]=0.01,m1[C]=0;
證據體m2:
m2[A]=0,m2[B]=0.01,m2[C]=0.99。
從證據體m1可以看出對目標A的支持最大,對其他兩個目標的支持概率明顯小于目標A;而證據體m2的概率分布情況和證據體m1明顯不同,證據體m2支持的目標是C??梢钥闯鰞蓚€證據源得到的證據體是高度矛盾的,根據證據理論的合成規則對兩個證據體進行合成,得到如下的概率分布結果,合成證據體m:m[A]=0,m[B]=1,m[C]=0。
從合成結果可以看出,對于兩個高沖突的證據體,如果以經典的證據理論合成規則進行融合,會得出有悖常理的結果。原證據體m1和m2分別支持目標A和C,而合成結果卻完全支持本來概率較低目
標B,這明顯不符合實際情況。這一算例也體現了證據理論合成規則的另一個問題,一票否決問題,即當證據體中某一命題被徹底否定時,該命題的融合結果也被一票否決,如例1中證據體m1否決目標A,融合結果A被否決。另外,根據證據理論合成規則的合成公式(1)可知,當沖突系數k趨近于1時,即兩個證據體完全沖突時,合成公式分母趨于零,證據理論合成規則失效。
本文應用證據理論主要是針對軍工系統的目標識別領域,對系統得到的多源信息,如果證據體間存在沖突,可以認為信息源存在干擾,是證據源本身的問題。所以采用的第二大類思想對證據理論進行優化,優化證據理論方法的思想流程如圖1所示。

圖1 證據理論優化流程圖Fig.1 Flow chart of optimized evidence theory
從圖1可以看出,首先從多個證據源得到信息,通過一定的方法計算各個信息源的證據體;其次計算各個證據體之間的沖突性,如果兩個證據體間存在沖突,通過一定方法計算各證據體的權重,然后得到新的證據體,否則直接合成;最后將新的證據體通過經典證據理論合成規則得到最終結果。
對證據體進行測量來分配證據體間的權重,通常認為兩個證據體間的距離越大,證據間的相似度越小,它們沖突性就越高。為了全面反映證據間的沖突情況,引入兩種距離函數來測量證據體。
2001年Jousselme等學者將向量空間引入證據理論[10],提出了一種距離函數來度量兩個證據間的相似情況,當距離函數值越大,表明兩個證據間的相似度越小。因此可以將Jousselme距離函數作為判斷證據間沖突情況的一個測量指標。Jousselme距離函數定義如下:
假定Θ為一包含N個兩兩不同的命題的完備的識別框架,m1和m2是在識別框架上的兩個概率分配函數,即兩個證據源的證據體,則m1和m2的Jousselme距離的具體的計算方法如式(5)所示。
(5)
式(5)中,m為證據體m的向量表示,‖m‖2=〈m,m〉為向量的內積,而內積具體算法如式(6)所示:
(6)
Pignistic概率距離,于2006年由學者Liu引入證據理論中[11]。Pignistic概率距離描述證據體間對于不同焦元支持程度的最大差別, Pignistic概率距離越大, 表明兩個證據體之間沖突越大。Pignistic概率距離具體定義如下:
假定Θ為一個的完備的識別框架,m為識別框架下的概率分配函數,Pignistic概率函數為:
1.4.1 檢查因素:為了明確病變的部位、病因、病理解剖和病理生理等診斷要素,除了問診和體檢,還需要做一系列的檢查,但各種檢查都存在敏感性和特異性的問題,也就是說這些檢查客觀上不是百分之百正確無誤的。至于正常值則是一個參考范圍,必然有一部分患者會納入正常,也會有一部分正常人歸為異常。此外,檢查結果有測定前誤差、測定誤差和測定后誤差。上述因素都會從客觀上干擾我們的思維,影響疾病的診斷。病理檢查的結果應當是特異性最高的實驗檢查,也是臨床醫師最為重視的報告。但病理檢查的各個環節都會影響結果,如標本的采集、固定和保存,切片染色以及閱片等等。
(7)
式(7)中,|A|為焦元A中包含的元素個數,BetPm的含義為各個子命題在識別框架上的概率分布情況,即對子事件的支持程度。
兩個證據體mi和mj之間的Pignistic概率距離定義為Pignistic函數差的最大值:
dP(mi,mj)=max(|BetPmi(A)-BetPmj(A)|)
(8)
對某一系統,從n個信息源得到n個證據體,當中間存在證據體與其他證據體沖突時,不可以按經典合成規則進行合成,需要將證據體進行調整。首先對于n個證據體,計算兩兩證據體之間的距離dij(Jousselme距離函數dJ和Pignistic概率距離dP),得到一個n×n的距離矩陣D:
(9)
通常認為,兩個證據體間的距離越大,相似度就越小,沖突性就越高。因為距離的范圍為0到1,所以定義兩個證據體之間的相似度sij為:
sij=1-dij,i,j=1,2,…,n
(10)
得到距離矩陣D后,計算兩兩證據體之間的相似度sij,可以得到相似度矩陣S:
(11)
接下來將相似度矩陣中每一行除自身的相似度之外的所有元素的和定義為每個證據體mi的支持度zi:
(12)
證據體mi的支持度zi反映了mi被其他證據體所支持的程度,從式(12)可以看出,它是相似度的函數。如果一個證據體與其他證據體比較相似,它們間相似度較高,則證據體的支持度數值越大; 如果一個證據體與其他證據體相似度較低,則證據體的支持度數值越小。將每個證據體的支持度歸一化處理后定義為可信度,它反映的是一個證據體的可信程度??梢哉J為,一個證據體被其他證據支持的程度越高,該證據體就越可信,它的權值就越大;如果一個證據體不被其他證據體所支持,則認為該證據的可信較低,權值就小。求得證據體mi的支持度zi之后,可以計算得到證據體mi的權值qi:
(13)

m(A)=q1×m1(A)+q2×m2(A)+…+
(14)

通過Jousselme距離dJ和Pignistic概率距離dP分別將n個證據體處理得到兩個新的證據體,將它們進行證據理論合成之后,用合成結果與得到新證據體dJ和dP的均值合成n-2次,得到最終結果。
為了驗證優化沖突證據融合方法的可行性與優越性,通過2個算例來仿真驗證。
例2 對于一個假定的識別框架Θ=(A,B,C),A,B,C為要識別的目標,來自同一探測系統的三個傳感器的探測結果為:
探測器1m1:
m1[A]=0.7,m1[B]=0.1,m1[C]=0.2;
探測器2m2:
m2[A]=0.8,m2[B]=0.1,m2[C]=0.1;
探測器3m3:
m3[A]=0.1,m3[B]=0,m3[C]=0.9。
以概率最大為判別原則,從例2可以看出,探測器1和2識別的目標為A,而證據體探測器3則為C,說明探測器3與探測器1,2的結果是沖突的,因此,應用本文介紹的優化方法,計算Jousselme距離函數下3個證據體的權值qJ=(0.42,0.39,0.19),繼而通過權值排序去除干擾項,得到Jousselme距離函數下新的證據體mJ=(0.706 9,0.094 3,0.199 0),計算Pignistic概率距離下3個證據體的權值qP=(0.43,0.39,0.18),同樣的處理得到Pignistic概率距離下新的證據體mP=(0.708 4,0.094 6,0.197 0)。有三個探測器的證據體,需要合成兩次。第一次為mJ和mP用證據理論合成規則合成,合成之后的結果再和mJ與mP均值合成一次,得到最終的融合結果:m=(0.976 3,0.002 3,0.021 4)。
從最終合成結果可以看出,三個探測器合成之后對目標A的支持度最大,符合實際情況,說明證據理論優化方法在處理沖突證據時是有效的。
例3 對于一個假定的識別框架Θ=(A,B,C),A,B,C為要識別的目標,來自同一探測系統的5個傳感器的探測結果為,
探測器1m1:
m1[A]=0.5,m1[B]=0.2,m1[C]=0.3;
探測器2m2:
m2[A]=0.0,m2[B]=0.9,m2[C]=0.1;
探測器3m3:
m3[A]=0.55,m3[B]=0.1,m3[C]=0.35;
探測器4m4:
m4[A]=0.55,m4[B]=0.1,m4[C]=0.35;
探測器5m5:
m5[A]=0.55,m5[B]=0.1,m5[C]=0.35。
分別用經典D-S證據理論方法、Mruphy合成方法[5]、Jousselme距離方法[6]、Pignistic概率距離方法[7]和本文優化方法對例3中的探測結果進行融合計算,計算結果如表1所示。
從例3題中可以看出,探測器1,3,4和5支持目標A,而探測器2支持目標B,與其他探測器結果沖突,可以認為探測器2受到干擾。通過表1的融合結果可以看出:對于經典D-S證據理論方法,目標A的識別概率一直為0,盡管其他的探測器都是支持目標A的,由于探測器2否決了目標A,最終結果也否決了目標A。Mruphy合成方法克服了經典D-S算法的缺點,從表1可以看出,隨著支持目標A的證據體增多,目標A的支持概率也隨之增大,如果以概率最大作為識別標準,Mruphy合成方法要在4個證據體融合時才能識別出目標A。Jousselme距離方法和Pignistic概率距離方法也隨著證據體的增多,克服了沖突探測器2對目標A的識別的干擾,對目標A的支持概率越來越大,識別目標A的情況越明顯,但收斂效率較低。本文新優化方法對沖突證據體做了很好的處理,在探測器2受到干擾時,通過加權處理能快速準確地識別目標A。優化方法考慮了證據體之間的相互關聯性,考慮了各個證據體的有效作用,降低了干擾項對最終融合結果的影響,在較少的證據體下就能使融合結果收斂為正確的目標。在多于兩個證據體融合的情況下,對目標A的識別概率,本文新優化方法明顯高于其他改進方法。

表1 各種方法融合結果對比表Tab.1 Comparison of various methods of fusion results
本文提出了優化的證據沖突融合方法。該方法綜合Jousselme距離和Pignistic概率距離在證據測量方面的優點,對沖突證據體進行了加權處理,并剔除了干擾項的影響。通過仿真計算和對比分析,結果表明本文所提出的優化的證據沖突融合方法相比于與幾種典型改進方法更好地解決了沖突證據體融合時出現的問題,且收斂效率高,提升了融合結果的可靠性和合理性,能準確有效地識別出目標,為軍事信息融合系統精準目標識別提供了重要的參考意義。