周劍,馬晨昊,劉林峰,孫力娟,肖甫
(1. 南京郵電大學計算機學院,江蘇 南京 210023;2. 江蘇省無線傳感網高技術研究重點實驗室,江蘇 南京210023)
基于區間證據理論的多傳感器數據融合水質判斷方法
周劍1,2,馬晨昊1,2,劉林峰1,2,孫力娟1,2,肖甫1,2
(1. 南京郵電大學計算機學院,江蘇 南京 210023;2. 江蘇省無線傳感網高技術研究重點實驗室,江蘇 南京210023)
針對傳感網測量水質數據過程中存在的必然不確定性和隨機不確定性,提出了一種基于區間證據理論的多傳感器數據融合水質判斷方法??紤]傳感器精度誤差以及測量數據異常等問題,將每個傳感器測量的水質數據用區間數表示,通過計算水質數據與每個水質等級特征值之間的距離,得到判斷水質等級的區間證據。按照區間證據組合規則將多傳感器的區間證據融合成綜合區間證據,最后根據決策準則,由綜合區間證據判斷水質等級。實驗表明,該方法能夠從不確定水質數據中準確判斷水質等級。
水質判斷;區間證據理論;傳感網;多傳感器數據融合;不確定性
水質監測是水污染防治的重要手段,傳統的水質監測主要以人工現場采樣、實驗室儀器分析為主。但傳統的水質監測存在監測頻次低、采樣誤差大、監測數據分散、不能及時反映水污染變化狀況等缺陷,難以滿足政府和企業進行有效水環境管理的需求[1,2]。目前,水質自動監測已經成了連續獲得水質數據的有效手段。其中,最常見的方法是通過部署多個傳感器來組成無線傳感網(WSN,wirelesssensor network)來收集水質數據。卞賀明等[3]設計了用于水質監測的傳感器芯片并構建了相關系統,但沒有涉及如何對水質進行判斷。張玨[4]提出基于無線傳感網的水質在線監測系統,該系統基于水質模型對水質進行預測,但并不能很好地判斷當前水質狀況。如何根據傳感網測量的數據進行水質判斷,是需要解決的問題。
無線傳感網包括多個傳感器,每個傳感器負責測量一定區域的水質,由于傳感器測量的數據眾多,如何處理多傳感器測量的眾多數據是水質判斷過程中的重點問題。在處理多傳感器數據方面,數據融合是一種將不同來源數據加以處理、融合,從而得到一個更精確結果的重要技術。近幾年,多傳感器數據融合技術得到了廣泛的關注,但更多應用是在目標識別[5]、隱私保護[6]、數據通信[7]等領域。本文將多傳感器數據融合技術應用于水質判斷。
一方面,傳感器在測量水質數據的過程中,由于傳感器精度問題,使測量的數據有一定誤差;傳感器測量的某些水質參數,如溶解氧會隨溫度、光照等因素而時刻發生變化,使測量的數據在一定范圍內擾動。上述情況會造成傳感網每次測量的數據具有不確定性,本文稱這種不確定性為必然不確定性。區間數是在20世紀70年代中期,由4位學者分別獨立地在模糊集合中提出。區間數能夠表示不確定信息或不完整信息,適合表達信息缺乏、不確定性高的數據[8]。本文用區間數來表示傳感器測量的帶有必然不確定性的水質數據。
另一方面,傳感器因自身老化可能會造成測量數據異常,其周圍環境異常變化也可能對無線傳感網的數據傳輸造成干擾,使傳輸的數據出現差錯。上述情況無法預測,本文稱這種無法預測的不確定性為隨機不確定性。處理這種不確定性的常見方法有Dempster-Shafer證據理論(D-S證據理論)和貝葉斯方法。貝葉斯方法的基本策略是,事先確定先驗概率和條件概率,則后驗概率可以用貝葉斯公式進行估計,文獻[9~11]將貝葉斯方法應用于多傳感器數據融合,但是,只有在先驗概率和條件概率充足且合適的時候才能夠得到有效融合。在很多情況下,先驗概率和條件概率不充足,D-S證據理論被認為是古典概率推理的擴展,能夠在先驗概率未知的情況下處理不確定性問題,得到較好的融合結果,因此,近年來,D-S證據理論引起了廣泛的研究和關注[12],文獻[13~15]將D-S證據理論用于多傳感器數據融合。
對于傳感網測量的水質數據中存在的必然不確定性和隨機不確定性,目前沒有合適的相關方法能夠同時處理,本文提出基于區間證據理論的多傳感器數據融合水質判斷方法。本文方法將傳感器測量的數據用區間數表示,將每個傳感器測量的數據作為判斷水質等級的一個證據,通過區間證據理論進行多傳感器數據融合,最后根據決策準則判斷當前水質等級。
1) 區間數[16]:設 R表示實數集。對任意的,如果則稱[c]為一個區間數。
當c?=c+時,區間數[c]即為普通實數;若 2個區間數[c]和[d]相等,則當且僅當c?=d?,c+=d+時,記作[c]=[d]。
2) 區間數基本運算[16]

D-S證據理論是Dempster于1967年首先提出,由他的學生Shafer于1976年進一步發展起來的一種不精確推斷理論,也稱為Dempster-Shafer 證據理論,具有處理不確定信息的能力。D-S證據理論[18,19]描述如下。
1) 識別框架:設Θ為一個集合,稱為識別框架。Θ中的元素相互排斥、有窮,通常表示所考察判斷的事物或對象。識別框架Θ的子集構成了求解問題的各種解答,Θ子集所構成的集合稱為Θ的冪集,記作?(Θ)。
2) 基本概率分配函數:也稱mass函數,定義如下。
Dempster組合規則:設A?Θ,m1和m2是Θ上的2個mass函數,則

在實際情況中,傳感器測量的數據會因傳感器老化、傳輸差錯而具有隨機不確定性。經典D-S證據理論在處理隨機不確定性上得到廣泛應用,但局限于單值數據。文獻[20,21]提出了區間基本概率分配(IBPA,interval basic probability assignment)。該形式的證據能夠較為全面地度量信息的不確定性,而且符合人的常性思維[21]。
在區間證據融合方面,Denoeux[20]構造二次規劃模型以融合多個IBPA,給出了IBPA 有效性和歸一化準則,提出了 Demspter 區間證據組合規則。基于Denoeux的研究,Wang等[21]提出了區間證據組合規則的求解方法。下面將對區間證據以及區間證據組合規則進行介紹。
令Θ為識別框架,A1, A2,???,An是n個Θ的子集,是n個區間數,
1) 區間基本概率分配




2) 歸一化準則

有效的 IBPA并不一定是歸一化的 IBPA,若IBPA未經歸一化,則可用式(4)進行歸一化處理。

對IBPA進行歸一化處理,可以降低冗余、減小區間寬度[22]。
3) Dempster區間組合規則
若[m]1和[m]2是有效且歸一化的IBPA,分別為和,融合結果標記為其區間值為



本文采用漂浮式傳感器節點對水質進行測量,如圖1所示。由于傳感器節點相互獨立,可以將每個傳感器節點測量的水質數據作為證據理論中的證據。本文對測量的水質數據進行計算,得到每個等級水質的 IBPA,通過區間證據組合規則得到每個水質等級的綜合信度分配,進一步按照決策準則得到水質等級判斷結果。

圖1 漂浮式傳感器

其中,[F]li表示水質等級為li的水質參數特征值,f表示溶解氧、氨氮、總氮、總磷等水質參數,m表示參數個數。每個特征值均為區間數。
在證據理論中,mass函數表示分配的信度。本文中 mass函數表示水質判斷為不同等級的區間信度。表示用傳感器k測量的水質數據計算得到的mass分配,其中,表示對其測量水域水質等級判斷為lt的區間信度,其值根據[S]k與lt等級水質參數特征值的距離計算得到。
由于傳感器測量的數據具有不確定性,為了能更準確地判斷水質等級,在區間證據組合之前,用可靠性系數C對mass函數進行修正。通過區間證據組合規則綜合修正后的 mass分配,得到綜合區間證據,最后按照決策準則判斷水質等級?;趨^間證據理論的多傳感器數據融合水質判斷過程如圖2所示。
在本文方法中,首要問題是如何將傳感器測量的原始數據轉化為區間證據,因此,需要對原始數據進行處理,構建mass函數。

圖2 基于區間證據理論的多傳感器數據融合水質判斷過程
顯然,[S]k與[F]li相差越小,當前水質等級為li的可能性越大;[S]k與[F]li相差越大,當前水質等級為li的可能性越小。本文基于區間閔可夫斯基公式[23]計算[S]k與[F]li的距離


傳感器測量數據帶有不確定性,為了能更準確地判斷水質等級,通過可靠性系數對mass函數進行修正。傳感器k的可靠性系數如式(10)所示。

其中,Nk表示傳感器k進行水質判斷的總次數,Rk表示傳感器k進行水質判斷正確的次數,β和Nmin為固定值,如果水質判斷的總次數小于等于Nmin,則使用β作為可靠性系數。
如果傳感器可靠性較高,該傳感器區間證據對應的可靠性系數較大,該區間證據在區間證據組合過程中對組合結果的影響較大;如果傳感器可靠性較低,該傳感器區間證據對應的可靠性系數較小,該區間證據在區間證據組合過程中對組合結果的影響較小。
經過可靠性系數修正后的mass函數為



通過該組合規則可以將多個傳感器的區間證據組合為(0,1)區間內的綜合區間證據,以表達對不同水質等級的綜合區間信度分配。得到每個水質等級的綜合區間信度后,按照以下決策準則判斷水質等級。
1) 最大區間信度對應的水質等級即為當前水質等級。
2) 最大區間信度的中點值應當比其他等級的區間信度中點值至少大ρ,否則該水質等級信度與其他等級信度過于接近,水質等級不確定。
3) 分配給Θ的區間信度應當滿足中點值不大于閾值γ,否則不確定度過大,水質等級不確定。
實驗中,本文使用自己開發的傳感器節點進行組網,對溶解氧(DO)、氨氮(NH3-N)、總磷(TP)、總氮(TN)等水質參數進行測量。設傳感器測量精度分別為pTN=0.5。根據《國家地表水環境質量標準(GB3838-2002)》將水質分為5個等級,每一等級的水質參數特征值如表1所示。

1) 實驗1
采用3個傳感器節點S1、S2和S3,對一片水域水質進行監測,表2為3個傳感器測得的水質數據。
從表1和表2中可以看出,傳感器S1、S3測量的水質數據接近水質等級Ⅲ,傳感器S2受到傳感器精度影響,導致測量的水質數據介于水質等級Ⅱ和Ⅲ之間。

表1 水質參數特征值

表2 傳感器S1、S2和S3測得的水質數據
根據式(8),可以得到傳感器 S1的測量數據與每個水質等級的水質參數特征值之間的距離D1。


通過式(9),可以得到傳感器 S1的每個水質等級mass函數值為:M1={[0.084 1,0.121 9], [0.130 4,0.228 8], [0.324 9, 0.472 6], [0.093 4,0.207 0], [0.048 0,0.099 4]}。類似地,可以得到傳感器S2和 S3的各mass函數值,如表3所示。
設傳感器S1、S2和S3進行水質判斷的總次數都為50,傳感器S1、S2和S3判斷正確的次數分別為43、42、40,因此可靠性系數分別為0.86、0.84、0.80。
將表3的各mass函數值按照式(11)進行修正,結果如表4所示。
從表4中可以看出,傳感器S1、S3支持水質等級為Ⅲ;傳感器 S2對水質等級為Ⅱ和Ⅲ的信度十分接近。將S1和S2的區間證據,按照式(13)進行組合,結果如表5所示。

表3 傳感器S1、S2和S3的各mass函數值

表4 傳感器S1、S2和S3修正后的各mass函數值

表5 S1、S2和S3區間證據組合結果
從表5可以看出,傳感器S1和S2的綜合區間證據對水質等級Ⅲ分配的信度最大,但為0.040 5,大于閾值γ,不確定度過高,按照決策準則,無法進行判斷。將傳感器S1、S2和S3的區間證據進行組合,結果同樣如表5所示。水質等級為Ⅲ的信度增大到[0.250 7, 0.711 5],降低到0.019 8,小于閾值γ。按照決策準則,可以判斷當前水質等級為Ⅲ。從本實驗可以看出,本文提出的方法能夠從帶有必然不確定性的水質數據中,得出準確的水質等級判斷結果。
2) 實驗2
在實驗1的基礎上,有另外2個傳感器節點S4和S5。測得的水質數據如表6所示。從表6中可以看出,傳感器 S4測得的水質數據不同于其他傳感器,該傳感器測量數據可能出現差錯。
通過式(11)計算出傳感器S4和S5的每個水質等級mass函數值,如表7所示。
傳感器S4和S5的可靠性系數分別為0.8和0.9,將表7中的各mass函數值按照式(11)進行修正,結果如表8所示。
從表8可以看出,傳感器S4給出了不同結論。按照式(13),將傳感器S1、S2、S3、S4的區間證據進行組合,結果如表9所示。可以看到,水質等級為Ⅲ的區間信度最大,其值為[0.152 9,0.742 9]。然而,按照決策準則,無法進行判斷。將傳感器S1、S2、S3、S4、S5的區間證據進行組合,結果同樣如表9所示??梢钥吹剑|等級為Ⅲ的信度增大到[0.199 1,為0.541 05。根據決策準則,判斷水質等級為Ⅲ類。從本文實驗中可以看出,所提方法能夠從帶有隨機不確定性的水質數據中,得出準確的水質等級判斷結果。
3) 實驗3
在水質判斷方法中,單因子水質標識指數法[24]是比較常用的水質判斷方法。將本文方法與單因子水質標識指數法進行對比。通過計算機仿真 10個傳感器節點,分別在傳感器錯誤率為40%、35%、30%、25%、20%的情況下,對一片已知水質等級的水域進行水質測量。每種錯誤率下仿真出 20組水質數據,同組數據分別采用本文方法與單因子水質標識指數法進行水質判斷,結果如表10所示。

表6 傳感器S4和S5測得的水質數據

表7 傳感器S4和S5的各mass函數值

表8 傳感器S4和S5修正后的各mass函數值

表9 S1、S2、S3、S4、S5區間信度組合結果
從表 10中可以看出,在不同的傳感器錯誤率情況下,本文方法得到的水質判斷正確率均要高于單因子水質標識指數法。采用單因子水質標識指數法,水質判斷錯誤率會隨著傳感器錯誤率的提高而提高。本文方法可以減小傳感器發生錯誤對水質判斷造成的影響,避免水質等級判斷錯誤,因此,本文方法要優于單因子水質標識指數法。由于水質數據的不確定性,本文方法會產生水質等級不確定的判斷,可以使用人工進一步分析,以得到更準確的水質判斷結果。

表10 本文方法與單因子水質標識指數法對比
本文將多傳感器數據融合技術應用于水質判斷。針對傳感網測量水質數據過程中存在必然不確定性和隨機不確定性,提出了一種基于區間證據理論的多傳感器數據融合水質判斷方法。在本文方法中,將每個傳感器測量的水質數據用區間數表示,并將其作為判斷水質等級的一個證據。將測得的水質數據與水質等級特征值計算距離,利用該距離構造mass函數。用可靠性系數對mass函數進行修正,按照區間證據組合規則對各傳感器的區間證據進行融合,得到每個水質等級的綜合區間證據。按照決策準則,判斷當前水質等級。實驗表明,本文方法能夠減小傳感器精度誤差對水質判斷造成的影響,能夠在個別傳感器數據異常的情況下,準確判斷出水質等級。
[1] ZHOU J, LIU L F, GUO J, et al. Multisensor data fusion for water quality evaluation using Dempster-Shafer evidence theory[J]. International Journal of Distributed Sensor Networks, 2013, (2):1-6.
[2] HALL J, SZABO J. Water sentinel online water quality monitoring as an indicator of drinking water contamination[R]. New York:Environmental Protection Agency, 2005.
[3] 卞賀明, 邊超, 佟建華, 等. 用于氨氮檢測的三維微納氨氣傳感芯片及系統研究[J]. 電子與信息學報,2012,34(5): 1258-1262.BIAN H M, BIAN C, TONG J H, et al. Miniaturized 3D micro/nano ammonia sensor chip and system for measurement of ammonia nitrogen[J]. Journal of Electronics amp; Information Technology, 2012,34(5): 1258-1262.
[4] 張玨. 基于無線傳感器網絡的水質在線監測系統研究[D]. 重慶:重慶大學, 2010.ZHANG J.Research on water quality online monitoring system based on wireless sensor network[D]. Chongqing: Chongqing University,2010.
[5] 閆光. 基于多傳感器信息融合的動態目標檢測與識別[D]. 北京:北京理工大學, 2015.YAN G. Moving target detection and recognition based on multi-sensor information fusion[D]. Beijing: Beijing Institute of Technology, 2015.
[6] 趙小敏, 梁學利, 蔣雙雙, 等. 安全的 WSN 數據融合隱私保護方案設計[J]. 通信學報, 2014, 35(11): 154-161.ZHAO X M, LIANG X L, JIANG S S, et al.Design of secure privacy-preserving data aggregation scheme for wireless sensor network[J]. Journal on Communications, 2014, 35(11): 154-161.
[7] 樂俊, 張維明, 肖衛東, 等. 無結構動態適應無線傳感器網絡數據融合算法[J]. 通信學報, 2012,33(9): 53-65.YUE J, ZHANG W M, XIAO W D, et al.Structure-free and dynamicadaptive data fusion algorithm for wireless sensor networks[J]. Journal on Communications, 2012, 33(9):53-65.
[8] 康兵義, 李婭, 鄧勇, 等. 基于區間數的基本概率指派生成方法及應用[J]. 電子學報, 2012, 40(6): 1902-1906.KANG B Y, LI Y, DENG Y, et al. Determination of basic probability assignment basedon interval numbers and its application[J]. Acta Electronica Sinica, 2012, 40(6): 1902-1906.
[9] BREHARD T, KRISHNAMURTHY V. Optimal data incest removalin Bayesian decentralized estimation over a sensor network[C]//The IEEE International Conference on Acoustics,Speech and Signal Processing. 2007: 173-176.
[10] WILSON D H, ATKESON C.Simultaneous tracking andactivity recognition (STAR) using many anonymous, binarysensors[C]//The 3rd International Conference onPervasive Computing. 2005: 62-79.
[11] MASKELL S. A Bayesian approach to fusing uncertain,impreciseand conflicting information[J]. Information Fusion, 2008,9(2): 259-277.
[12] 于美婷, 趙林靖, 李釗.基于 DS證據理論的協作頻譜感知改進方法[J]. 通信學報, 2014, 35(3): 168-173.YU M T, ZHAO L J, LI Z. Improved cooperative spectrum sensing scheme based ondempster-shafer theory in cognitive radio network[J].Journal on Communications, 2014,35(3):168-173.
[13] BASIR O, YUAN X. Engine fault diagnosis based on multisensory information fusion using dempster-shafer evidencetheory[J]. Information Fusion, 2007,8(4): 379-386.
[14] ZHU D, GU W. Sensor fusion in integrated circuit faultdiagnosis using a belief function model[J]. International Journalof Distributed Sensor Networks, 2008,4(3):247-261.
[15] LI J M, LUO S H, JIN J S. Sensor data fusion for accuratecloud presence prediction using Dempster-Shafer evidencetheory[J].Sensors,2010,10(10): 9384-9396.
[16] ALEFELDA G, MAYERB G. Interval analysis: theory and applications[J]. Journal of Computational and Applied Mathematics,1999, 121(1/2): 421-464.
[17] 曾文藝, 羅成忠, 肉孜阿吉. 區間數的綜合決策模型[J].系統工程理論與實踐,1997,17(11): 48-50.ZENG W Y, LUO C Z, ROZI H. Comprehensive decision model ofiInterval-number[J]. System Engineering Theory and Practice,1997,17(11): 48-50.
[18] DEMPSTER A P. Upper and lower probabilities induced by amultiple valued mapping[J]. The Annals of Mathematical Statistics, 1967, 38(2):325-339.
[19] SHAFER G A. Mathematical theory of evidence[M]. Princeton:Princeton University Press, 1976.
[20] DENOEUX T. Modelling vague belief using fuzzy-valued beliefstructures[J]. Fuzzy Sets and Systems, 2000, 116(2): 167-199.
[21] WANGY M, YANGJ B,XU D L, et al. The evidential reasoning approach for multiple attribute decision analysis using interval belief degrees[J].European Journal of Operational Research, 2006, 175(1): 35-66.
[22] 馮海山, 徐曉濱, 文成林.基于證據相似性度量的沖突性區間證據融合方法[J]. 電子與信息學報, 2012, 34(4): 851-857.FENG H S, XU X B,WEN C L. A new fusion method of conflicting interval evidencebased on the similarity measure of evidence[J]. Journal of Electronics amp; Information Technology, 2012, 34(4): 851-857.
[23] 曾文藝,趙宜賓.基于區間數度量的區間值模糊集合的歸一化距離、相似度、模糊度和包含度的關系研究[J]. 模糊系統與數學, 2012,26(2):81-90.ZENG W Y,ZHAO Y B. Relationship among the normalized distance,the similarity measure,the entropy and the inclusion measure of interval-valued fuzzy setsbased on interval-number measurement[J].Fuzzy Systems and Mathematics, 2012, 26(2): 81-90.
[24] 徐祖信.我國河流單因子水質標識指數評價方法研究[J]. 同濟大學學報(自然科學版), 2005,33(3): 321-325.XU Z X. Single factor water quality ident ification index for environmentalquality assessment of surface water[J]. Journal of Tongji University (Natural Science), 2005, 33(3): 321-325.
Multi-sensor data fusion method for water quality evaluation based on interval evidence theory
ZHOU Jian1,2, MA Chen-hao1,2, LIU Lin-feng1,2, SUN Li-juan1,2, XIAO Fu1,2
(1. College of Computer, Nanjing University of Posts and Telecommunications, Nanjing 210023, China;2. Jiangsu High Technology Research Key Laboratory for Wireless Sensor Networks, Nanjing 210023, China)
For the inevitable uncertainty and random uncertainty in the process of measuring water quality data with the sensor network, a multi-sensor data fusion method for water quality evaluation based on interval evidence theory was proposed. Considering the precision error of sensor and the abnormalities of measured data, every water quality data measured by sensor was represented by interval number. By calculating the distance between the water quality data and the features of each water quality class, the interval evidence of water quality class was acquired. According to the interval evidence combining rule, a comprehensive interval evidence was obtained by combining the interval evidence of each sensor. Finally, the water quality class was determined based on the comprehensive interval evidence by the decision rule. Experiments show that the proposed method can evaluate water quality class more accurately from the uncertain water quality data.
water quality evaluation, interval evidence theory, sensor network, multi-sensor data fusion, uncertainty
s: The National Natural Science Foundation of China (No.71301081, No.61373139, No.61572261, No.61300165,No.61302157), The Natural Science Foundation of Jiangsu Province (No.BK20130877, No.BK20140895), Postdoctoral Science Foundation of China (No.2014M551637), Postdoctoral Science Foundation of Jiangsu Province (No.1401046C), The Scientific Research Foundation of Nanjing University of Posts and Telecommunications (No.NY213035)
TP393
A
10.11959/j.issn.1000-436x.2016174
2016-05-29;
2016-09-06
劉林峰,liulf@njupt.edu.cn
國家自然科學基金資助項目(No.71301081, No.61373139, No.61572261, No.61300165, No.61302157);江蘇省自然科學基金資助項目(No.BK20130877, No.BK20140895);國家博士后基金資助項目(No.2014M551637);江蘇省博士后基金資助項目(No.1401046C);南京郵電大學引進人才基金資助項目(No.NY213035)

周劍(1984-),男,江蘇揚州人,南京郵電大學副教授,主要研究方向為傳感器網絡、數據融合。

馬晨昊(1990-),男,河南新鄉人,南京郵電大學碩士生,主要研究方向為數據融合。

劉林峰(1981-),男,江蘇丹陽人,南京郵電大學副教授,主要研究方向為傳感器網絡。

孫力娟(1963-),女,江蘇南京人,南京郵電大學教授,主要研究方向為傳感器網絡。

肖甫(1980-),男,湖南邵陽人,南京郵電大學教授,主要研究方向為傳感器網絡。