楊呈永,劉佳祎
(桂林理工大學(xué) 現(xiàn)代教育技術(shù)中心, 廣西 桂林 541006)
物聯(lián)網(wǎng)的概念最早可追溯到1999年, 由Kevin等提出。 國(guó)際電信聯(lián)盟(international telecommunication union,ITU)在2005年11月的報(bào)告中對(duì)“物聯(lián)網(wǎng)”的概念和特征[1]以及未來發(fā)展過程中將面臨的困難等方面進(jìn)行論述,并將相關(guān)成果發(fā)布到《ITU Internet reports 2005—The Internet of Things》中。 為了達(dá)到人與物相交互的目的, 人們利用如無線傳感器、 RFID、 GPS 等設(shè)備將現(xiàn)實(shí)中的物品進(jìn)行網(wǎng)絡(luò)連接, 并將這一過程稱為物聯(lián)網(wǎng)[2]。 基礎(chǔ)設(shè)施的不斷完善使得物聯(lián)網(wǎng)核心技術(shù)也得到了快速發(fā)展, 并在日常生活的各個(gè)方面得到應(yīng)用。 由于不同的應(yīng)用服務(wù)商監(jiān)測(cè)的目標(biāo)各不相同, 進(jìn)而產(chǎn)生了數(shù)量巨大的待處理監(jiān)測(cè)數(shù)據(jù), 如果不能及時(shí)高效地處理, 將會(huì)在網(wǎng)絡(luò)傳輸過程中造成嚴(yán)重的帶寬資源浪費(fèi)。 由于物聯(lián)網(wǎng)的各個(gè)節(jié)點(diǎn)的工作狀態(tài)不能夠保證穩(wěn)定, 所以物聯(lián)網(wǎng)的數(shù)據(jù)存在著嚴(yán)重的不確定性問題。
信息融合作為可以把所獲取的多源信息對(duì)比、分析和評(píng)估后得到的有效信息進(jìn)行融合處理的一種熱點(diǎn)技術(shù),具有更加精確、更加全面的判別力,深受學(xué)者們的青睞[3-4]。目前,國(guó)內(nèi)外研究學(xué)者針對(duì)D-S證據(jù)理論[5]這一熱點(diǎn)信息融合技術(shù)的研究主要有:利用數(shù)學(xué)模型修正證據(jù)源的沖突證據(jù)合成方法[6-7];徐琰珂等將模糊邏輯算法進(jìn)行優(yōu)化用于提高信息融合系統(tǒng)的穩(wěn)定性[8];文獻(xiàn)[9-11]中重點(diǎn)介紹貝葉斯網(wǎng)絡(luò)和層次分析法等算法與原D-S證據(jù)理論的結(jié)合;如何用D-S證據(jù)理論解決某一具體應(yīng)用中存在的問題[12-15]。
通過上述文獻(xiàn)可發(fā)現(xiàn),在D-S證據(jù)理論中的單一問題,學(xué)者們作了良好的改進(jìn)與分析,且在D-S證據(jù)理論的實(shí)際應(yīng)用中,人們常常只關(guān)注融合后的最終結(jié)果,并不關(guān)注事件本身的特征,這樣會(huì)造成底層融合數(shù)據(jù)特征的流失。因此,如何在融合過程中,對(duì)事件進(jìn)行多維度的分析成為目前急需解決的重點(diǎn)問題。
數(shù)據(jù)融合是一種將多源數(shù)據(jù)進(jìn)行融合處理的技術(shù), 是智能信息處理技術(shù)的范圍。 通過將各個(gè)節(jié)點(diǎn)的數(shù)據(jù)進(jìn)行充分分析和整合得到對(duì)監(jiān)測(cè)對(duì)象的最佳一致估計(jì), 比單一的數(shù)據(jù)源更為精準(zhǔn)、 全面[16], 從而使用戶作出正確的選擇。 數(shù)據(jù)融合算法經(jīng)過多年的發(fā)展, 有一些算法形成了比較成熟的方法, 還有一些算法是學(xué)者研究的熱點(diǎn)。 常見的數(shù)據(jù)融合方法主要有: 古典概率推理、 貝葉斯方法、 神經(jīng)網(wǎng)絡(luò)、 模糊集理論、 D-S證據(jù)理論。
1)古典概率推理。古典概率討論的范圍僅限于隨機(jī)試驗(yàn)產(chǎn)生的等可能結(jié)果的情形[17]。每次試驗(yàn)有有限個(gè)結(jié)果,而且結(jié)果出現(xiàn)的可能性一致。缺點(diǎn)是無法直接應(yīng)用先驗(yàn)知識(shí),一次只能評(píng)估兩個(gè)假設(shè)事件等。
2)貝葉斯方法。貝葉斯(Bayes)發(fā)展的比較早,該方法是基于最大后驗(yàn)和似然比檢驗(yàn),如果先驗(yàn)概率能夠算出,貝葉斯方法將是一個(gè)很好的解決方法。但是在實(shí)際問題求解中很難獲得先驗(yàn)概率,即確定先驗(yàn)的似然函數(shù)非常困難。而且,傳統(tǒng)的貝葉斯要求條件復(fù)雜苛刻[18],很難滿足和實(shí)現(xiàn),這就限制了貝葉斯的應(yīng)用。貝葉斯也無法處理廣義的不確定問題。
3)神經(jīng)網(wǎng)絡(luò)。近年來以神經(jīng)網(wǎng)絡(luò)(neural networks)進(jìn)行數(shù)據(jù)融合的技術(shù)取得了很大的進(jìn)步[19]。神經(jīng)網(wǎng)絡(luò)的工作原理和人類大腦類似,模擬人腦的思維,該算法具有簡(jiǎn)單的并行分布式計(jì)算、平行分布式處理(速度快)、容錯(cuò)性高、數(shù)據(jù)魯棒性等特點(diǎn)。神經(jīng)網(wǎng)絡(luò)允許多個(gè)信號(hào)的輸入和多個(gè)變量的輸出,經(jīng)過系統(tǒng)訓(xùn)練,把數(shù)據(jù)分配到正確的分類中輸出,適合多變量系統(tǒng)。神經(jīng)網(wǎng)絡(luò)可以在訓(xùn)練過程中輸入沒有出現(xiàn)過的新數(shù)據(jù),并進(jìn)行識(shí)別,因此該算法可以進(jìn)行學(xué)習(xí)和自適應(yīng)。通過神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí),可以很好地適應(yīng)無數(shù)學(xué)模型和難以建立數(shù)學(xué)模型的推理過程。神經(jīng)網(wǎng)絡(luò)的神經(jīng)元一般是線性的,要處理復(fù)雜的非線性問題,還需要進(jìn)一步的改進(jìn)和發(fā)展。此外,神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù)若不是很充分,將不能夠正常工作,這也是一個(gè)局限。
4)模糊集理論。模糊集(Fuzzy Sets)理論在模糊集的基礎(chǔ)上發(fā)展起來,由于具有處理模糊問題的能力和模糊推理的優(yōu)勢(shì),被廣泛地應(yīng)用于信息融合領(lǐng)域[20]。模糊理論和模糊邏輯也被應(yīng)用到多源數(shù)據(jù)融合技術(shù)中。模糊集將數(shù)據(jù)元素與集合關(guān)系的絕對(duì)化處理為模糊概率化。源數(shù)據(jù)在模糊集處理之前只有存在或不存在集合兩種關(guān)系,經(jīng)過模糊運(yùn)算處理之后,表示為源數(shù)據(jù)在集合中存在概率的多少,然后用一定的方法統(tǒng)一融合決策。
5)D-S證據(jù)理論。Dempster于1967年提出了證據(jù)理論,Shafer把該理論推廣到更一般情形。D-S(Dempster-Shafer)證據(jù)理論在貝葉斯的基礎(chǔ)上作了推廣,引入信任函數(shù)的概念,借助了多重證據(jù)來確定決策結(jié)論。通過給命題(如今天的氣溫)分配一定的信任函數(shù),對(duì)多個(gè)問題的不精確描述有效分析后,再利用相應(yīng)的公式將矛盾數(shù)據(jù)有效排除和整合,便可得到確定數(shù)據(jù)。同傳統(tǒng)的數(shù)據(jù)融合方法相比,D-S證據(jù)理論最大的特點(diǎn)是以證據(jù)的形式來表現(xiàn)數(shù)據(jù)的不確定性,且證據(jù)理論擺脫了貝葉斯理論對(duì)先驗(yàn)知識(shí)的依賴。D-S證據(jù)理論的不確定性推理過程可以解決物聯(lián)網(wǎng)節(jié)點(diǎn)產(chǎn)生的不確定性數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行融合運(yùn)算,得到較為確定的數(shù)據(jù)[21-22]。
本文以D-S證據(jù)理論為基礎(chǔ), 研究在物聯(lián)網(wǎng)環(huán)境下, 如何更好解決數(shù)據(jù)的不確定性問題。
1967年,為紀(jì)念A(yù).P.Dempster和G.Shafer兩位學(xué)者在證據(jù)理論方面作出的突出貢獻(xiàn),人們將證據(jù)理論稱為Dempster-Shafer理論。
用Φ集合來表示已了解的情況下所有可能出現(xiàn)的判決結(jié)果的集合。如果Φ中的任一個(gè)子集表示人們所關(guān)心的任一命題,則稱Φ為識(shí)別框架。

設(shè)Φ代表一個(gè)識(shí)別框架信度集函數(shù)A: 2Φ→[0,1]必須同時(shí)滿足3個(gè)條件:A(O)=0;A(Φ)=1;當(dāng)?M1,M2,…,Mt?Φ時(shí),有
(1)
由式(1)可知,D-S證據(jù)理論在整個(gè)框架中都存在不確定的信度。


當(dāng)M≠O時(shí),
(2)
當(dāng)多個(gè)信度函數(shù)A1,A2,…,Ai在同一框架Φ上時(shí),它們所對(duì)應(yīng)的基本可信度分配分別為n1,n2,…,ni。 假設(shè)?M?Φ,M≠O且A1?∧?An存在基本可信度分配,用n表示,則有:
(3)

由式(2)和式(3)可知,無論有多少個(gè)證據(jù),相結(jié)合次序都不會(huì)影響其結(jié)果,可以用兩個(gè)證據(jù)的計(jì)算來遞推得到多個(gè)證據(jù)結(jié)合的計(jì)算。
對(duì)于物聯(lián)網(wǎng)節(jié)點(diǎn)的數(shù)據(jù)融合來說,將物聯(lián)網(wǎng)中的各個(gè)節(jié)點(diǎn)看成一個(gè)命題,則具有識(shí)別、判斷及處理等功能的傳感器所展示的結(jié)果即為該命題對(duì)應(yīng)的證據(jù)。若想要將物聯(lián)網(wǎng)中多個(gè)節(jié)點(diǎn)的數(shù)據(jù)進(jìn)行融合時(shí),則將采集到的數(shù)據(jù)進(jìn)行度量,然后建立相應(yīng)的基本概率分布函數(shù)作為可信度指標(biāo)。各個(gè)函數(shù)和對(duì)應(yīng)的框架稱為一個(gè)證據(jù)體,故在物聯(lián)網(wǎng)節(jié)點(diǎn)中每個(gè)傳感器都是一個(gè)證據(jù)體。利用Dempster合并規(guī)則在同一個(gè)框架下將每個(gè)證據(jù)體組合成完整的證據(jù)體,這就是物聯(lián)網(wǎng)節(jié)點(diǎn)數(shù)據(jù)融合的本質(zhì)。圖1展現(xiàn)了基于物聯(lián)網(wǎng)節(jié)點(diǎn)的D-S數(shù)據(jù)融合方法,其中,n1(Mj),n2(Mj),…,ni(Mj)為i個(gè)節(jié)點(diǎn)的基本可信度分配;j=1,2,…,n;n(Mj)為經(jīng)過Dempster合成法則結(jié)合成的新的基本可信度分配。

圖1 基于物聯(lián)網(wǎng)節(jié)點(diǎn)的D-S數(shù)據(jù)融合Fig.1 D-S data fusion based on IOT nodes
在物聯(lián)網(wǎng)各節(jié)點(diǎn)中多個(gè)傳感器系統(tǒng)的數(shù)據(jù)融合中,首先對(duì)系統(tǒng)進(jìn)行第一次基本可信度分配,傳感器每一次報(bào)警,節(jié)點(diǎn)就會(huì)發(fā)送一個(gè)具有可分配的基本可信度;然后根據(jù)圖1中的法則將這些基本可信度進(jìn)行合并得到最終結(jié)果;最后根據(jù)可信度和似真度等指標(biāo)來判斷命題的合理性,將決策結(jié)果輸出。
在多個(gè)節(jié)點(diǎn)數(shù)據(jù)融合中,龐大的數(shù)據(jù)量使傳統(tǒng)的計(jì)算方式難以適用,設(shè)A為n個(gè)證據(jù)結(jié)合計(jì)算后的結(jié)果,1~n為n個(gè)證據(jù),采用兩個(gè)證據(jù)結(jié)合的計(jì)算方法遞推出n個(gè)證據(jù)結(jié)合的計(jì)算,如圖2所示,其中,左側(cè)為傳統(tǒng)的直接計(jì)算,右側(cè)為遞推n個(gè)證據(jù)結(jié)合的計(jì)算。

圖2 多個(gè)證據(jù)等效結(jié)構(gòu)圖Fig.2 Equivalent structure of multiple evidences
因?yàn)槲锫?lián)網(wǎng)的節(jié)點(diǎn)監(jiān)測(cè)能力不同,發(fā)送數(shù)據(jù)的可靠性不同,節(jié)點(diǎn)的能耗也不同。如果某一個(gè)可靠性高的節(jié)點(diǎn)突然發(fā)生了故障,導(dǎo)致節(jié)點(diǎn)發(fā)送的數(shù)據(jù)產(chǎn)生了很大的誤差,此時(shí),在融合的過程中如果還按照原來的權(quán)重進(jìn)行基本概率分配,就會(huì)產(chǎn)生與實(shí)際情況不符的錯(cuò)誤。因此,本文在原有節(jié)點(diǎn)權(quán)重的基礎(chǔ)上再進(jìn)行一個(gè)權(quán)重的修改,在數(shù)據(jù)融合的同時(shí)考慮節(jié)點(diǎn)能力大小和節(jié)點(diǎn)沖突性。當(dāng)一部分?jǐn)?shù)據(jù)與其他大部分?jǐn)?shù)據(jù)存在較大的沖突時(shí), 即使這個(gè)節(jié)點(diǎn)的能力很大, 權(quán)重很高, 也認(rèn)為這一部分?jǐn)?shù)據(jù)可能會(huì)不準(zhǔn)確, 將會(huì)相應(yīng)地對(duì)該權(quán)重進(jìn)行微調(diào), 盡量使這些不精準(zhǔn)的數(shù)據(jù)對(duì)結(jié)果沒有過多影響。 弱化壞的數(shù)據(jù)對(duì)最終決策的支持, 在一定程度上優(yōu)化最終融合結(jié)果。
假設(shè)有識(shí)別空間Φ={M1,M2,…,Mn},其中M1,M2,…,Mn是各種假設(shè),證據(jù)集合E={E1,E2,…,Em},每個(gè)證據(jù)對(duì)應(yīng)的權(quán)重集合為W={w1,w2,…,wm}。每個(gè)證據(jù)的沖突ki情況按照D-S證據(jù)理論的沖突概率大小定義為
(4)

得到每個(gè)證據(jù)的沖突概率狀況后,根據(jù)每個(gè)證據(jù)的沖突概率和整個(gè)識(shí)別空間的沖突概率對(duì)比,再進(jìn)行權(quán)重調(diào)整。整個(gè)識(shí)別空間的沖突概率表示為
(5)
這時(shí)引入原來的節(jié)點(diǎn)權(quán)重,根據(jù)沖突概率的大小來決定權(quán)重總量W
W=m×k0×wmin,
(6)
其中,wmin是原權(quán)重中的最小值。這里的權(quán)重總量考慮了沖突狀況。
根據(jù)權(quán)重總量作調(diào)整,原有的權(quán)重大小減去權(quán)重總量的平均數(shù),也就是每一個(gè)證據(jù)的權(quán)重減去了沖突部分的權(quán)重:
(7)
最后調(diào)整權(quán)重的大小,節(jié)點(diǎn)的權(quán)重大小表示為
(8)
基于節(jié)點(diǎn)加權(quán)的D-S證據(jù)理論方法的步驟為
輸入:待融合目標(biāo)M={M1,M2,…,Mn},n個(gè)節(jié)點(diǎn)的信任度函數(shù)ni(M)以及相應(yīng)節(jié)點(diǎn)權(quán)重wi,初始化i=1。
輸出:融合目標(biāo)的結(jié)果。
步驟:
①計(jì)算每一個(gè)證據(jù)ni(M)的沖突概率ki,根據(jù)沖突概率調(diào)整相應(yīng)的基本概率分配,得到新的基本概率分配。
②計(jì)算n1(M)和n2(M)的沖突系數(shù)K。當(dāng)K≠1時(shí),調(diào)用D-S證據(jù)融合公式進(jìn)行數(shù)據(jù)融合得到融合數(shù)據(jù)n(C)。
③循環(huán)n-2次。計(jì)算n(C)和ni+2(M)的沖突系數(shù)K。當(dāng)K≠1時(shí),調(diào)用D-S證據(jù)融合公式更新融合數(shù)據(jù)n(C)。
④循環(huán)結(jié)束,得到最終的融合結(jié)果n(C)。
為驗(yàn)證物聯(lián)網(wǎng)中數(shù)據(jù)傳輸?shù)牟淮_定性,本文選擇物聯(lián)網(wǎng)中節(jié)點(diǎn)1、2、3、4這4個(gè)節(jié)點(diǎn),在Windows XP操作系統(tǒng)的電腦上采用NS2仿真軟件進(jìn)行模擬仿真實(shí)驗(yàn)。假設(shè)在一個(gè)盒子中有且僅有3種顏色的球:紅、黃、綠,記在盒子里取出球的顏色種類{紅球、 黃球、 綠球}為監(jiān)測(cè)目標(biāo),表示為A、B、C,則這4個(gè)節(jié)點(diǎn)分別對(duì)應(yīng)的信任函數(shù)為m1,m2,m3,m4。
通過NS2仿真軟件可得到一組有效數(shù)據(jù),4個(gè)節(jié)點(diǎn)的權(quán)重值分別為0.1,0.2,0.5,0.2。對(duì)監(jiān)測(cè)目標(biāo){紅球、黃球、綠球}的信任度分別為:
m1(A)=0.1,m1(B)=0.8,m1(C)=0.1;
m2(A)=0.2,m2(B)=0.7,m2(C)=0.1;
m3(A)=0.8,m3(B)=0.1,m3(C)=0.1;
m4(A)=0.1,m4(B)=0.7,m4(C)=0.2。
由上述數(shù)據(jù)可得基本概率分配(表1)。

表1 四個(gè)節(jié)點(diǎn)的概率分配
根據(jù)本文提出的證據(jù)理論方法,系統(tǒng)得到最終的基本可信度分配;然后根據(jù)可信度和似真度等指標(biāo)來判斷命題的合理性,將決策結(jié)果輸出;最后按照傳統(tǒng)的D-S證據(jù)理論公式合成最終的數(shù)據(jù)結(jié)果。根據(jù)節(jié)點(diǎn)的權(quán)重計(jì)算最后的融合數(shù)據(jù)為{0.142, 0.782, 0.085},其結(jié)果為黃球。
為了檢測(cè)不同節(jié)點(diǎn)權(quán)重下的D-S證據(jù)融合理論的結(jié)果,將4個(gè)節(jié)點(diǎn)中的一個(gè)去掉,變成節(jié)點(diǎn)1、2、3這3個(gè)節(jié)點(diǎn),監(jiān)測(cè)目標(biāo)的信任函數(shù)分別為監(jiān)測(cè)目標(biāo)紅球A、黃球B、綠球C。通過NS2仿真生成相關(guān)數(shù)據(jù)(表2)。

表2 不同節(jié)點(diǎn)權(quán)重下兩種方法的比較
可以看出, 傳統(tǒng)的D-S證據(jù)理論不考慮節(jié)點(diǎn)的性能,只是依照證據(jù)進(jìn)行數(shù)據(jù)融合, 不適用于物聯(lián)網(wǎng)這種大的環(huán)境。而基于節(jié)點(diǎn)加權(quán)的D-S證據(jù)理論能夠充分將數(shù)據(jù)節(jié)點(diǎn)的可靠性、節(jié)點(diǎn)性能的大小,以及自身發(fā)出數(shù)據(jù)與其他節(jié)點(diǎn)發(fā)出數(shù)據(jù)的沖突等綜合考慮。其結(jié)果說明D-S方法在目標(biāo)識(shí)別及節(jié)點(diǎn)加權(quán)的數(shù)據(jù)融合中最大程度支持正確結(jié)果。
為進(jìn)一步檢測(cè)D-S方法在目標(biāo)識(shí)別及節(jié)點(diǎn)加權(quán)的數(shù)據(jù)融合中最大程度支持正確結(jié)果,本文采用文獻(xiàn)[22]中使用的數(shù)據(jù)集進(jìn)行測(cè)試,選取該數(shù)據(jù)集中的6類,共211 570個(gè)網(wǎng)絡(luò)流樣本,圖3有效展示數(shù)據(jù)集屬性的分布情況,算法的檢測(cè)概率和虛警概率如圖4、圖5所示。
在物聯(lián)網(wǎng)底層中具有大量的數(shù)據(jù)節(jié)點(diǎn),由于環(huán)境等因素的影響導(dǎo)致很多傳輸數(shù)據(jù)具有不確定性,將數(shù)據(jù)進(jìn)行加權(quán)有效降低數(shù)據(jù)融合后的不確定性,由上述兩圖可知,算法突出了對(duì)樣本的識(shí)別判斷能力,在采用節(jié)點(diǎn)加權(quán)樣本數(shù)據(jù)的情況下,可以有效識(shí)別判定出被觀測(cè)對(duì)象的屬性。雖然其檢測(cè)概率略低于不含節(jié)點(diǎn)加權(quán)樣本數(shù)據(jù)的情況,但是虛警概率明顯較低。由此可證明,基于物聯(lián)網(wǎng)節(jié)點(diǎn)加權(quán)的D-S證據(jù)理論數(shù)據(jù)融合算法在較低虛警概率下具有較好的檢測(cè)概率。

圖3 數(shù)據(jù)集屬性分布Fig.3 Data set attribute distribution

圖4 算法的檢測(cè)概率Fig.4 Detection efficiency of the algorithm

圖5 算法的虛警概率Fig.5 False alarm efficiency of the algorithm
本文為解決海量數(shù)據(jù)節(jié)點(diǎn)產(chǎn)生和傳輸中的不確定性,提出在物聯(lián)網(wǎng)節(jié)點(diǎn)加權(quán)的基礎(chǔ)上用D-S證據(jù)理論對(duì)數(shù)據(jù)進(jìn)行融合,并且設(shè)定目標(biāo)識(shí)別的決策規(guī)則。在NS2的基礎(chǔ)上進(jìn)行物聯(lián)網(wǎng)數(shù)據(jù)融合的仿真實(shí)驗(yàn)。利用基于節(jié)點(diǎn)權(quán)重的D-S證據(jù)理論對(duì)數(shù)據(jù)進(jìn)行融合,根據(jù)節(jié)點(diǎn)權(quán)重大小以及節(jié)點(diǎn)間產(chǎn)生沖突概率的情況,對(duì)節(jié)點(diǎn)的權(quán)重進(jìn)行調(diào)整,并按照D-S證據(jù)理論公式進(jìn)行融合。通過NS2仿真軟件進(jìn)行對(duì)比實(shí)驗(yàn),模擬結(jié)果表示基于節(jié)點(diǎn)加權(quán)的D-S證據(jù)理論可將證據(jù)沖突性、節(jié)點(diǎn)性能大小等眾多因素綜合考慮,驗(yàn)證在數(shù)據(jù)融合方面的有效性,即使節(jié)點(diǎn)權(quán)重很大,只要發(fā)生多次沖突就減小權(quán)重,保證融合結(jié)果的正確性,同時(shí)可使用戶在收到融合數(shù)據(jù)后最大程度貼近真實(shí)效果。
桂林理工大學(xué)學(xué)報(bào)2019年3期