嚴志軍,陶 洋
重慶郵電大學 通信與信息工程學院,重慶 400065
在無線傳感器網絡實際的應用中,傳感器采集到的數據經常是不精確和不確定的,如何有效地解決不確定信息一直是研究的熱點,許多研究者提出了很多數學理論,如證據理論[1]、模糊集理論[2]、粗糙集理論[3]等,其中,由Dempster和Shafer提出來的D-S證據理論能夠有效解決在缺乏先驗概率的條件下數據不精確和不確定的問題[4-5],并且廣泛應用于信息融合領域[6-9]。
但是,不同的傳感器采集到的數據之間可能會出現沖突的現象,當直接利用Dempster融合規則處理沖突信息時,會出現悖論的融合結果。因此如何有效地處理無線傳感器網絡中數據沖突的問題,將是不可避免的[10-12]。Murphy提出在融合之前對證據進行修正,首先對信度函數進行平均化,之后再對數據進行融合的一種方法[13]。但是,這種證據平均的融合方法僅僅簡單地對證據進行平均化,并沒有考慮證據之間的聯系。因此,并不能夠很好地處理由錯誤數據引起的數據沖突的情況。鄧勇教授則對融合規則進行提升,提出了一種加權平均的融合方法[14],雖然在一定程度上克服了Murphy規則的缺陷,但是卻忽視了證據本身對最后權重的影響;而文獻[15]則引入向量空間的概念,運用沖突證據的表示方法來解決數據沖突的問題,但是此方法僅考慮了不同證據信度分配結果的相似程度而忽略了其他因素對證據可信度的影響,如證據本身的不確定性。
基于以上分析,本文運用證據距離對證據之間的沖突性進行度量,將證據分為可信證據與不可信證據兩類;接著運用信度熵對證據本身的不確定度進行估計,結合這兩類因素對證據進行權重分配,對原始證據的基本信度值進行修正,最后運用Dempster融合規則進行融合,提出了一種基于證據距離和不確定度的沖突數據融合算法。提出的方法既考慮了證據之間的相互關聯性,又考慮了證據本身的不確定性,因此能夠很好地處理沖突數據融合的問題。
證據理論(Evidence Theory)[16],是一種很好的對不確定性進行建模和推理的數學理論,設識別框Θ={w1,w2,…,wc},基本信度分配函數(BBA),即質量函數,m:2Θ→[0,1],滿足以下條件:

其中,A是2Θ的一個子集,m(A)即為命題A的基本信度值,表示證據對命題A的支持度,每個命題都有對應的BBA,且BBA之間相互獨立,對于?A?Θ,A≠?,Dempster組合規則定義為:

其中,i表示第i個證據。證據之間的沖突程度k定義為:

相比其他融合規則,貝葉斯融合需要事先了解概率分布,即需要知道先驗概率;同樣,基于模糊集理論的融合方法也需要事先了解不同模糊集的隸屬函數,但是Dempster融合規則可以在事先不知道先驗概率的條件下,對不確定、不精確的數據進行建模[17];并且,對來自于不同傳感器數據源得到的不同證據,能夠簡單高效地融合多個證據,并且最終能夠得到更加準確的融合結果。
相對距離表示了證據體之間的相互支持度。其中使用較廣泛、認可度高的是Jousselme提出來的證據距離表示方法[18]。
兩個證據體m1()和m2()之間的距離dBOE(m1,m2)定義如下:

其中,m1和m2分別表示證據體m1()和m2()的向量形式。是2Θ×2Θ的矩陣:

當有多個證據時,任意兩個證據體之間的距離可以以證據矩陣DM的形式表示,定義如下:

兩個證據之間的距離越大,表示兩個證據之間相互支持度就越低。如果一個證據體與其他證據高度沖突,則它應該對最后的融合結果有較小的影響。
信度熵[19]能夠有效地對信息的不確定度進行度量。設定假設集Ai,對應的信度函數為m, ||Ai表示集合Ai的元素個數,集合Ai信度熵計算如下:

當信度值僅分配給單元素集時,信度熵此時直接是香農熵,此時信度熵函數為:

如果一個證據體的信度熵越小,則相應的可靠度也越高,在最后的融合過程中,占據的權重也越大;相反,如果一個證據的信度熵越大,則不可靠度越高,占據的權重也越低。
假設有n個證據,mi,i=1,2,…,n,對于證據的預處理過程可以表示如下:

其中,wi是證據mi對應的權重。wimi可以認為是mi的折扣,m可以認為是原證據的加權平均證據。這n個證據是所有獲得焦元的平均加權。因此如何構建合適的權重wi將是核心問題。
上文提到,假如一個證據與其他證據的證據距離越小,則表明它與其他證據的沖突性也較小,可將這類證據稱之為可信任證據;相反,假如一個證據與其他證據的證據距離越大,則表明它與其他證據的沖突性也越大,可將此類證據稱之為不可信證據。對于可信任證據,熵值越小,則表明不可確定度也越小,證據本身也更明確,更有利于最后的決策融合。因此,在融合過程中,此類證據應該占更大的權重。而對于不可信證據,熵值越小,對應的不確定度也越小,證據體本身也更明確。但是,因為與可信任證據和其他證據具有沖突性,為了得到更準確的融合結果,將分配較小的權重給不可信證據。基于此思想,提出了獎勵函數與懲罰函數的概念,以此來創建合適的權重。
定義1(獎勵函數)定義為:

其中為歸一化后的信度熵,滿足獎勵函數具有如下的特性:
特性1獎勵函數總是大于0,即αr>0。
特性2獎勵函數是單調遞減函數。
證明 根據指數函數的特性,很明顯,獎勵函數是單調遞減的函數。它隨著熵值的增大而減少,隨著熵值的減少而增大,符合可信函數的特性,因此用來創建可信函數的權重。
定義2(懲罰函數)定義為:
這里,信度熵,滿足懲罰函數有如下的特性
特性1懲罰函數永遠大于0,即αj>0。
特性2懲罰函數是一個單調遞增的函數。
證明 假設有任意兩個變量

因為,根據指數函數的特性有:是說,懲罰函數是單調遞增的函數,可用來為不可信證據創建權重。
假設有n個證據體,每個證據體權重的推導過程如下:
步驟1通過公式(4)和(5)可以計算任意兩個證據mi和mj之間的距離矩陣:

其中i,j=1,2,…,n。
步驟2計算證據體mi的平均證據距離

步驟3計算證據體全局距離d:

步驟4判斷證據是可信證據或者非可信證據:如果>d,則mi為可信證據;如果 <d,則mi為非可信證據。
步驟5計算信度熵Ed(mi),i=1,2,…,n,并且進行歸一化處理:

步驟6為可信證據與不可信證據分配相應的權重αr和αj,i,j=1,2,…,n,對于可信證據使用公式(10)計算其相應的權重,對于非可信證據使用公式(11)計算其相應的權重。
步驟7最后對計算得到的權重進行歸一化處理,得到證據最終的權重wi,計算如下:

通過以上推導,計算得到了每個證據合理的權重值,再根據公式(9)計算多源證據的加權平均證據m。最后通過Dempster融合規則對修正后的證據源進行BBA融合,得到最終的融合結果。
需要指出的是,當證據僅有兩個證據時,此時,證據距離是失效的,此時的權重的計算方式如下:
步驟1計算信度熵Ed(mi),i=1,2,使用公式(16)對其進行歸一化。
步驟2通過獎勵函數計算權重αi1:
步驟3通過懲罰函數計算權重αi2:

其中是最大歸一化信度值。
步驟4計算平局權重αi:

即為最終的權重wi,最后計算加權平均證據,使用Dempster融合規則進行融合。
為了驗證文中提出的算法的性能,本文將采用文獻[20]中的完整算例進行仿真分析與對比。設有3個目標待識別,即識別框為:Θ={A,B,C},收集到5個證據對其進行判別:


首先,根據公式(5)和(6)計算距離矩陣得:

運用公式(14)計算平均證據距離,i=1,2,3,4,5,0.298 6。
接著運用公式(15)計算全局證據距離d的結果如下:d=0.403 74。可知,m1,m3,m4,m5歸為可信證據,而m2為不可信證據。通過公式(8)計算每個證據體所對應的信度熵為:

再通過公式(16)計算歸一化信度熵:

通過公式(18)與(19)分別計算可信證據與不可信證據的權重αi,i=1,2,3,4,5,通過公式(17)歸一化權重得:w1,w2,w3,w4,w5,如表1所示。

表1 歸一化權重
計算出每個證據的權重之后,通過平均權重對原始數據進行修正,得出以下修正后的BBA,如表2所示。
在得到修正后的BBA之后,再利用Dempster融合規則對多個證據進行融合,得到最終的融合結果,如表3所示。
在使用本文提出的融合算法計算出最終融合結果之后,再使用四種應用廣泛的融合規則計算出相應的融合結果,并且進行對比,具體的融合結果以及仿真對比圖如圖1,2所示。

圖1 基于不同融合規則的m(A)的BBA

圖2 基于不同融合規則的m(B)的BBA
從仿真結果圖1以及表4可以得出盡管5個證據源中有4個證據源支持目標A,但是由于沖突證據S2,Dempster融合規則融合后得出一個錯誤的結果。很明顯,Dempster融合不能夠很好地處理數據沖突的問題。
從仿真圖2可以得出,由于不可信證據S2,只有本文提出的基于不確定度和信度熵的融合方法分配較小的信度給目標B,然而其他的融合方法都分配較多的信度給B。同時還可以得出,當有三個證據源時,Dempster規則、Deng規則,以及Murphy法則融合結果并不能為融合中心提供決策,因為這三種法則分配給目標A的信度值都小于0.5,其他的目標B,C,AC的信度值分配較多,只有Han融合規則和本文提出的融合規則分配給A的信度值高于0.5,并且新的融合法則分配給目標A的值高達0.827 4,然后Han法則只有0.518 8。當有5個證據源進行融合時,證據源越多,信度值分配得越合理,新的融合方法將信度值基本上分配給了目標A,高達0.990 4。

表2 使用平均權重修正后的BBA

表3 融合后的結果
因此,當證據高度沖突時,經典的Dempster融合規則融合的結果將會產生嚴重的悖論,不能夠很好地反映真實的情況。隨著證據體的增加,盡管Murphy簡單平均融合規則、Deng加權平均融合規則以及Han融合規則都能夠給出一個合理的融合結果,但是,本文提出的基于證據距離和不確定度的沖突數據融合規則性能都比這幾種融合法則優秀。
本文對使用經典證據理論進行融合的過程中,當遇到高沖突的數據時,融合結果會產生悖論等問題進行詳細的分析,以往的研究更多的是考慮證據之間的相互關聯性,而忽視了證據本身對融合性能的影響。本文通過一種新的信度熵的方法對證據本身的不確定性進行度量,最后的實驗結果證明提出的基于證據距離和不確定度估計的沖突數據融合方法能夠更有效地處理沖突數據融合的問題。
:
[1]Dempster A P.Upper and lower probabilities induced by a multivalued mapping[J].Ann Math Stat,1967,38(2):325-339.
[2]Klein L A.Sensor and data fusion:a tool for information assessment and decision making[M].Bellingham’WA:SPIE Press,2004.
[3]Pawlak Z.Rough sets[J].International Journal of Computer and Information Sciences,1982,11(5):341-356.
[4]Su X,Mahadevan S,Han W,et al.Combining dependent bodies of evidence[J].Appl Intell,2016,44(3):634-644.
[5]Jiang W,Yang Y,Luo Y,et al.Determining basic probability assignment based on the improved similarity measures of generalized fuzzy numbers[J].International Journal of Computers Communications&Control,2015,10(3).
[6]LLiu Z G,Pan Q,Dezert J.A belief classification rule for imprecise data[J].Applied Intelligence,2014,40(2):214-228.
[7]Wang X,Huang J Z.Editorial:uncertainty in learning from big data[J].Fuzzy Sets&Systems,2014,258:1-4.
[8]Jiang W,Wei B,Xie C,et al.An evidential sensor fusion method in fault diagnosis[J].Advances in Mechanical Engineering,2016,8(3).
[9]Yang Y,Han D.A new distance-based total uncertainty measure in the theory of belief functions[J].Knowledge-Based Systems,2015,94:114-123.
[10]Xu Xiaobin,Liu Ping,Sun Yanbo,et al.Fault diagnosis based on the updating strategy of interval-valued belief structures[J].Chinese Journal of Electronics,2014,23(4):753-760.
[11]Moosavian A,Khazaee M,Najafi G,et al.Spark plug fault recognition based on sensor fusion and classifier combination using Dempster-Shafer evidence theory[J].Applied Acoustics,2015:120-129.
[12]Yu C,Yang J,Yang D,et al.An improved conflicting evidence combination approach based on a new supporting probability distance[J].Expert Systems with Applications,2015,42(12):5139-5149.
[13]Murphy C K.Combining belief functions when evidence conflicts[J].Decision Support Systems,2000,29(1):1-9.
[14]Yong D,Shi W K,Zhu Z F,et al.Combining belief functions based on distance of evidence[J].Decision Support Systems,2004,38(3):489-493.
[15]Zhang Z,Liu T,Chen D,et al.Novel algorithm for identifying and fusing conflicting data in wireless sensor networks[J].Sensors,2014,14(6):9562-9581.
[16]Jameslnglis.A mathematical theory of evidence[J].Technometrics,1976,20(1).
[17]Su X,Mahadevan S,Xu P,et al.Handling of dependence in Dempster-Shafer theory[J].International Journal of Intelligent Systems,2015,30(4):441-467.
[18]Jousselme A L,Grenier D,Bossé é.A new distance between two bodies of evidence[J].Information Fusion,2001,2(2):91-101.
[19]Deng Y.Deng entropy:a generalized Shannon entropy to measure uncertainty[J/OL].Vixra.org,2015.
[20]Han D Q,Yong D,Han C Z,et al.Weighted evidence combination based on distance of evidence and uncertainty measure[J].Journal of Infrared&Millimeter Waves,2012,30(5):396-400.