項新建,李可晗,曹 楹,黃炳強,鄭永平
(浙江科技學院自動化與電氣工程學院,浙江 杭州 310023)
隨著信息技術的不斷發展,單一傳感器采集的信息已經不能滿足農業、工業和軍事等領域的需要,與單感器相比,多傳感器數據有更高的參考價值。由于多傳感器系統采集的數據可能會存在一定的不確定性和矛盾性,因此怎樣更好地處理多傳感器數據,進一步提高數據融合結果的可靠性,是目前數據融合技術領域的熱門研究方向。
Dempster-Shafer(D-S)證據理論作為一種數據融合算法,能夠很好地處理“不確定”和“不知道”的問題,被廣泛運用于目標識別、故障分析和多屬性決策分析等領域[1]。 然而其在處理沖突證據時,容易產生與事實相悖的結論。 目前,對于D-S 證據理論的改進主要分為兩個方面:對組合規則的改進[2-4]以及對證據體的改進[5-13]。 前者把產生與事實相悖的結果歸責于D-S 規則本身,雖然取得了一定的效果,但破壞了D-S 規則本身的優勢,而后者在保留Dempster 規則優良特性的同時弱化了沖突證據對融合結果的影響,因此在實際應用中,對證據體的改進從各方面上看都更為合理[5]。
對證據體的改進方法可分為兩大類:折扣系數法和加權平均法。 以胡昌華[6]為代表的學者提出折扣系數法,根據證據間的相互距離確定證據權重,并修正證據,將不確定的部分分配給全集,雖能提高結果可靠性,但是會影響收斂速度和聚集效果[7]。 以Murphy[8]和Deng[9]為代表的學者提出加權平均法,對證據進行加權平均處理后進行融合,有更好的融合效果,因此本文采用加權平均法處理證據。 然而Murphy[8]利用簡單平均法給每個證據賦予相同的權重,Deng[9]依據信任度確定證據權重,二者均充分利用證據信息。 確定證據體權重的方法有兩種:根據證據自身特性和根據證據間的關系,且目前尚未存在統一確定證據權重的方法。 前者又可分為兩類:一是基于信息熵,雖能在一定程度上描述證據自身的特性,然而使用該類方法處理證據的方式較為片面,僅用證據部分信息代替了整個不確定區間[10];二是區間距離,如趙靜等[10]提出利用定積分區間距離來衡量證據的不確定性,但是計算較為復雜,Deng 等[11]提出一種基于證據置信區間的海林格距離衡量證據不確定度的方法,能夠較好地度量證據自身特性,從而達到較好的融合效果。 對于后者,在單一關系測度無法準確測量證據間關系的情況下[12],多數學者提出利用多關系測度衡量證據間關系的方法,如王路等[12]結合余弦相似度和Jaccard 系數衡量了證據間關系,然而這兩個測度均為相似性測度,對證據間關系的分析不夠全面,許將軍等[13]基于證據間的相似度以及沖突系數定義了新的證據沖突度,然而其并沒有考慮到證據單焦元和多焦元的關系。
為了充分挖掘異構多傳感器數據信息,解決多傳感器數據存在沖突性等問題,提高數據融合的準確率,本文提出一種基于證據支持度和確定度的證據理論融合方法。 首先,結合Jaccard 系數改進沖突系數K和余弦相似度,并結合二者計算證據間支持度,第一次修正證據;其次,利用修正后證據焦元區間的蘭氏距離衡量證據的自身確定度;最后,基于確定度與支持度生成證據總權重,加權平均處理證據后,按Dempster 規則進行融合。 本文通過算例和應用證明了所提方法的有效性。
定義1在D-S 證據理論內,設Θ=θ1,θ2,…,θn為有限識別框架,基本信任函數m是從集合2Θ→[0,1]的映射,A為Θ的任一子集,滿足:
稱m為Θ的基本概率分配函數(簡稱BPA 函數)[14],若m(A)>0,則稱A為識別框架Θ內的一個焦元,m(A)反映了證據對A的信任程度。
定義2設Θ為識別框架,m為其BPA 函數,則
稱Bel(A)為信任函數,為A全部子集的基本概率分配之和,表示命題A的確定度。
稱Pl(A)為似然函數,表示不否認A的信任度。 稱[0,Bel(A)]為命題A的支持區間,[Bel(A),Pl(A)]為命題為A的置信區間,[Pl(A),1]為證據的拒絕區間。 其中支持區間和拒絕區間共同構成證據的確定區間,可表示證據的確定度。 證據的各區間如圖1 所示。

圖1 證據區間圖
定義3設m1,m2為同一有限識別框架Θ上的2 個BPA 函數,則定義m1和m2的Dempster 組合規則為:
式中:K為證據m1和m2沖突系數,其值越大,證據間的沖突程度越大。
本文在上述理論的基礎上,提出一種基于證據確定度和支持度的證據加權方法,提高融合結果的準確性。
根據式(5),可以得出D-S 規則定義下的沖突系數K,然而在一定的情況下,該系數并不能正確地表示證據間的沖突度,比如當兩個證據完全相同時,有:
可算出沖突系數K為0.80,表明兩個數據存在高度沖突,該結論與事實相悖。
Xu 等[13]提出結合沖突系數K和余弦相似度衡量證據全局沖突度的方法,然而該方法在衡量多焦元證據體時,會出現不夠準確的情況,降低融合結果的準確性。 如有證據m1和m2:
分別利用沖突系數K和Xu 等[13]所提的方法計算證據m1和m2的沖突度,得到的結果均為0,表明證據完全相似。 然而由于無法判斷證據m2對各焦元的支持度,因此兩個證據存在一定的沖突,因此沖突系數K和Xu 等[13]方法所計算的沖突度均與事實不符。
結合上述分析,沖突系數K在度量相同證據和多焦元證據時,均會出現失效的情況,且余弦相似度同樣不能準確度量多焦元證據之間的關系[12]。Jaccard系數可用于比較兩個樣本之間的差異性和相似性,其值越高,則兩個樣本相似度越高[15]。 因此,本文提出使用Jaccard 系數改進沖突系數K和余弦相似度的方法,并結合改進后的余弦相似度和沖突系數共同度量證據之間的關系,提高融合結果的可靠性。
定義4假設有證據mi和mj,識別框架Θ=θ1,θ2,…,θn,定義證據局部相似度為s′ij,局部沖突度為Kij:
結合所計算的局部相似度和局部沖突度,可得證據的局部支持度sij,從而得到證據基于支持度的權重αi:
可基于證據焦元的區間距離衡量證據自身的特性,如證據的置信區間距離越長,代表不確定信息越多,對應的證據不確定性也越大。 蘭氏距離常被用于確定樣本間距離,因其適合大規模處理數據,且對于接近于0(大于等于0)的值的變化非常敏感,本文提出結合證據支持區間和拒絕區間的蘭氏距離衡量證據確定度的方法。
假設X={x1,x2,…xn},Y={y1,y2,…yn}是隨機變量Z的兩個概率分布向量,則其蘭氏距離為:
定義5假設識別框架Θ=A1,A2,…,An,定義DU(mi)為證據確定度,計算方法如下:
將所求得的確定度DU(mi)歸一化處理后可得證據基于確定度的權重:
證據的確定度是從證據自身出發,用來反映證據自身可信程度,證據的確定度越高,對應的權值也越高;證據的支持度衡量了證據之間的沖突關系,支持度越高,表示證據在證據群中的可信度越高。 證據自身的確定度和證據間的支持度互不影響,且都是證據內可獲取的有效信息。 僅考慮其中之一處理證據,都將破壞證據信息的完整性,因此,考慮證據確定度和支持度來修正證據的方式更合理。
隨著國家“健康中國”戰略的實施,健康管理已經上升到非常重要的高度。對于從事健康管理的人員而言,如何正確認識健康管理的核心內涵及在實踐中成功的實施至關重要。這就需要我們深入地思考健康管理的合理化模式,并在實踐中不斷地加以修正。
綜上所述,給出本文所提方法的具體步驟:
Step 1 結合式(6)和式(7),計算出基于證據支持度的權重αi(αi的取值范圍為[0,1]),根據權重αi對數據按修正公式(11)進行第一次修正。
Step 2 計算修正后的各證據體的信任函數和似然函數,按照式(9)和式(10)計算出基于證據確定度的權重βi。
Step 3 根據權重αi和βi,計算出證據體的總權重,將其歸一化后得到最終權重ωi,具體計算方式如下:
Step 4 依據權重ωi,對原證據進行加權融合:
Step 5:按照D-S 證據理論融合規則,對融合后的證據體m進行n-1 次融合。
本節分別從沖突證據融合、多數量證據融合和正常證據融合三個方面分析驗證所提方法的有效性。
證據理論內共有四種常見的沖突種類:完全沖突、0 信任沖突、1 信任沖突和高沖突[16],四種常見沖突的BPA 函數如表1 所示。 利用本文所提融合方法分別對表1 內常見沖突證據體進行融合,對比傳統證據理論及經典改進方法,融合結果如表2所示。

表1 四種常見沖突BPA 函數

表2 四種常見沖突的融合結果
由于王路等[12]提出了一種結合信任度和確定度的方法,本文所提方法在許將軍等[13]所提出的沖突度計算方法上進行了改進,且借鑒了Deng 等[11]利用證據焦元區間距離衡量的思想,因此本文將上述三種方法作為相似方法。 表3、表4 分別為多數量單、多焦元沖突證據體的BPA 值分布。

表3 單焦元證據分布

表4 多焦元證據體數據分布
不同數量下的單、多焦元證據權重圖如圖2、圖3 所示。 從圖2、圖3 可以看出,處理不同的單、多焦元證據時,王路[12]、許將軍[13]和本文所提方法均降低了沖突證據的權重,而本文所提方法的沖突證據權重更小,說明了該方法處理沖突證據時有更優異的性能,證明了其有效性。 由于Deng[11]的方法衡量的是證據自身的不確定度,與證據之間的關系無關,因此該方法并沒有降低沖突證據的權重。

圖2 單焦元證據權重圖

圖3 多焦元證據權重圖
各方法的融合結果如表5~表6 所示,從融合結果和對比結果可以看出:面對不同數量下單、多焦元沖突證據體,傳統證據理論融合結果均與事實相悖。對于不同數量的證據體融合,雖然Deng、王路和許將軍和本文方法均指向正確結果,但本文方法有更高的BPA 函數,且收斂速度更快。

表5 單焦元沖突數據融合結果

表6 多焦元沖突證據體融合結果
表7 為正常證據體數據分布,表8 為融合結果。從表8 可以看出,面對正常不沖突的證據體,本文所提方法同樣能得到正確結果,并且對比傳統的證據理論算法,有更高的BPA 函數,可信度更高。

表7 正常證據體數據分布

表8 正常證據體融合結果
綜上所述,本文所提的證據融合方法在處理正常證據和沖突證據時,較傳統證據理論、經典改進方法和相似改進方法,均有更好的融合性能。
將本文所提的方法應用于雷達目標識別領域,對比傳統證據理論與相似改進方法,證明該方法的有效性。
雷達識別庫中有3 個雷達型號數據,分別為A,B,C,設識別框架Θ={A,B,C},現有五個異構傳感器分別對某一雷達輻射源進行識別,結果見表9[17]。

表9 雷達識別BPA 值
根據式(6)和式(7),計算出各證據基于支持度權重αi:
利用αi,按式(11)對證據進行第一次修正,修正后按式(9)、式(10)計算基于證據焦元區間距離計算確定度DU(mi)和基于確定度的權重βi:
根據式(12),可算出證據的整體權重ωi:
使用權重ωi對原證據進行加權處理,得到證據m,按D-S 組合規則進行n-1 次融合,所得結果與Deng[11]、王路[12]、許將軍[13]和劉康[17]方法的結果進行對比,如表10 所示。

表10 雷達識別結果表
從計算所得的相關參數可以看出,本文所提的方法大大降低了沖突證據的權重。 根據各方法融合結果可得,傳統證據理論在雷達識別過程中出現與事實相悖的結果。 隨著證據數量的改變,所提方法的融合結果均保持不變,都指向正確命題雷達A。雖然Deng、許將軍、王路和劉康的方法均指向正確的結果,但是本文所提方法有更高的BPA 函數,對結果為雷達A的置信度更高,驗證了其處理沖突證據的有效性。
為更好地處理多傳感器系統采集數據的不確定性和沖突性,提高數據融合的準確率,提出一種基于支持度和確定度的異構數據融合方法。 把多傳感器內各類數據看作不同的證據,結合改進后的沖突系數和余弦相似度確定證據支持度,并第一次修正證據。 利用修正后焦元區間的蘭氏距離衡量證據確定度,并基于支持度和確定度得到證據總權重加權處理證據,最后用D-S 規則進行融合。 通過算例和應用結果證明,所提方法面對沖突證據和正常證據均能得到正確結果,并且該方法對比傳統證據理論、經典改進方法和相似改進方法,均能得到更高的BPA函數,提高了融合準確率,有更好地解決沖突和聚焦能力,證明其有效性和穩定性,為多傳感器數據融合提供了一定的參考價值。 如何結合同構和異構數據融合方法,共同構成完整的多傳感器數據融合方法,有待進一步研究。