翟羽婷,史春燕,王 磊
(1.張家口學院理學院,河北 張家口 075000;2.中國科學院蘇州生物醫學工程技術研究所,江蘇 蘇州 215163)
一種面向無線體域網的低能耗數據融合隱私保護算法*
翟羽婷1,史春燕1,王 磊2*
(1.張家口學院理學院,河北 張家口 075000;2.中國科學院蘇州生物醫學工程技術研究所,江蘇 蘇州 215163)
無線體域網能夠借助低能耗高精度傳感技術實時采集并分析多種模態的人體健康體征數據,需要在數據傳輸過程中對關系到個人隱私的健康敏感數據進行保護。針對無線體域網數據融合過程中的隱私保護需求提出一種針對性更強的低能耗數據融合SMART-RR算法,利用人體健康數據存在周期重復性和健康數據冗余特點,提出不等長時間間隔、加入重復性歸約因子的數據融合策略。仿真實驗表明,SMART-RR算法是一種數據通信量小、高隱私保護性和高精確度的低能耗數據融合隱私保護算法,在面向無線體域網的人體健康體征數據采集分析領域具有一定應用價值。
無線體域網;數據融合;隱私保護;低能耗;重復性歸約
隨著無線通信技術、物聯網以及低能耗傳感設備開發技術的不斷進步,無線傳感器網絡WSN(Wireless Sensor Network)得到長足發展,在健康醫療、環境監測、國防建設等諸多領域得到廣泛應用。無線體域網WBSN(Wireless Body Sensor Network)是WSN在健康醫療領域的一個重要分支,已經吸引了包括遠程醫療、遠程監護、社區養老等多領域研究者的關注[1-2]。WBSN通過將植入式、可穿戴式或者近體式等不同種類的低能耗傳感器節點安置于人體體內或體表,收集多種模態的人體健康體征數據,比如體溫、心電、脈搏、血壓、血氧等信息并通過無線通信網絡逐級上傳到數據采集父節點,基于數據挖掘與智能分析技術輔助醫護人員對人體健康狀況做出判斷。
基于體域網的健康數據系統能夠實時采集大規模多模態的人體健康數據,為精準醫療和健康大數據分析提供了可能性,研究者已經針對WBSN數據融合算法進行了深入研究[3-5]。WBSN中的健康數據沿著數據融合樹形結構逐級上傳并融合,這些數據包含了大量的關系個人健康狀況的隱私信息,一旦傳感網絡中的某些節點被惡意入侵,這些敏感的隱私信息就有被監聽的可能,導致健康數據融合異常,造成難以估計的健康數據安全災難,影響用戶對基于無線傳感器網絡技術的遠程醫療和健康監護的信任。
為了提高無線傳感器網絡中數據融合的安全性,研究者提出了多種不同的加密技術和算法,包括密鑰分配算法、同態加密算法等。密鑰加密算法通過給WSN中的傳感器節點預分配密鑰的方式進行加密保護,防止網絡傳輸過程中的敏感信息被監聽泄露,但是由于數據融合過程加入了頻繁的密鑰分配與解密操作,往往降低了數據融合效率,增加了傳感器節點的能耗[6]。為了提高數據融合效率,文獻[7]提出了一種面向WSN的同態加密算法,在加密密文基礎上進行融合計算,但是這種方法的隱私保護性有所減弱,如果傳感器網絡中某些節點被惡意入侵后,可能導致相鄰節點中的隱私數據不能得到有效保護。文獻[8]在密鑰分配算法基礎上提出了CPDA(Cluster-based Private Data Aggregation)和SMART(Slice Mix AggRegaTe)兩種算法,傳感器節點采集數據之后首先進行分片操作并傳送到不同的節點,以這種方式增強敏感數據的隱私保護性,即使網絡內部某些節點被入侵攻破,也不能清晰解析得到完整準確的數據。楊庚等[9]在分析了SMART算法由于對傳輸數據進行分片操作導致數據融合精確度有所下降的不足之后,提出了加入多種優化因子的一系列改進算法,通過對比實驗與分析驗證了所提出算法在隱私保護性、精確度以及分片接收率等方面的性能。由于WBSN采集得到的人體健康數據往往具有多模態特性,可以在現有的隱私保護算法基礎上進一步研究針對多模態健康數據的數據分片策略、基于不等長時間間隔數據的數據融合算法,從而提高健康數據隱私保護性并且降低WBSN網絡通信量。
本文針對面向體域網健康數據采集與智能分析的個人健康敏感數據安全性和精確性需求,在SMART及相關算法的基礎上加入局部優化因子,提出一種數據融合隱私保護算法,降低WBSN中傳感器節點數據冗余度和傳感網絡通信量的前提下提高個人健康數據的隱私保護性。本文第1節對基于無線體域網的健康數據采集分析系統模型進行討論,介紹健康數據監測系統的拓撲結構和低能耗傳感器節點;第2節從SMART系列算法應用在WBSN中的缺陷分析出發,提出基于樹形結構的數據融合模型和加入優化因子的數據融合隱私保護算法并進行理論證明;第3節通過仿真實驗對算法的隱私保護性、數據通信量和精確度等性能進行分析評價;第4節總結所研究的內容并展望未來工作。
WBSN通過將低功耗、高精度的傳感器置于被監測人體的體表或體內,借助WSN技術組網形成一套能夠實時采集并傳輸人體健康數據的無線傳感器網絡結構,從而支持健康醫療數據分析,為遠程醫療、實時監護提供支持。本節首先介紹基于無線體域網的健康數據檢測系統拓撲結構,然后描述用于人體健康數據采集的低能耗傳感器節點。
1.1 健康數據監測系統拓撲結構
基于無線體域網的人體健康數據采集與分析系統硬件拓撲結構如圖1所示,由置于人體體表的多種體征數據傳感器節點、數據傳輸節點和數據分析節點組網實現。

圖1 基于無線體域網的健康數據系統拓撲結構
置于人體體表的多種健康體征數據傳感器分別采集獲得人體的脈搏、體溫、腦電、心電、血壓和血氧信息,并通過無線通信網絡周期性地傳遞給上一級數據傳輸節點;數據傳輸節點收集多模態的人體健康數據,進行噪聲等垃圾數據的過濾,并根據數據類型進行第一層級的數據融合計算,將計算結果上傳到數據分析節點;數據分析節點獲得初步處理后的健康數據信息,并進行最終的數據融合計算,此時得到的信息對于輔助醫護人員做出人體健康體征判斷具有參考價值。
1.2 應用于WBSN的低能耗傳感器節點
在健康醫療領域的實際應用中,WBSN往往采用低能耗高精度的無線傳感器節點進行布點與數據采集。首先,用于采集人體健康體征數據的每個無線傳感器節點是能量受限的,必須嚴格控制傳感器節點的能耗從而延長整個傳感網絡的生存時間[10]。WBSN中的無線傳感器節點的能量主要消耗在無線網絡通信過程中,因此需要盡量降低傳感器節點之間的數據通信量和數據冗余。其次,由于受到人體活動、外部環境電磁干擾等影響,WBSN傳感器節點采集到的數據經常伴隨各種噪聲信號,降低了所獲取健康體征數據的準確性和完整性[11]。
WBSN中的各種傳感器節點獲取多模態人體健康數據之后通過樹形無線傳感網絡逐層上傳并融合,數據傳輸通信量和加密解密機制直接影響敏感的個人健康數據隱私保護性和WBSN能耗性。本節將WBSN抽象為包含三層結構的樹形網絡,提出一種基于重復性規約因子的數據融合算法,并利用密鑰分配機制提高數據隱私保護性。
2.1 基于樹形結構的數據融合模型
WBSN可以用一個連通有向圖G(V,E)表示,其中頂點v(v∈V)表示WBSN中的節點,有向弧e(e∈E)表示節點之間的數據傳輸鏈路。典型的WBSN一般包含3種類型節點:(1)葉子節點,由采集和傳輸人體健康數據的多種傳感器組成;(2)融合節點,數據傳輸節點承擔收集多模態健康數據并進行數據融合計算功能;(3)QS(Query Server)節點,數據分析節點負責數據的最終融合分析。由上述三類節點組成樹形結構的數據融合過程如圖2所示。

圖2 基于樹形結構的數據融合過程
3種類型的節點構成樹形結構,其中QS節點作為根節點得到數據融合結果并提供進一步健康體征分析的依據,融合節點負責從葉子節點接收數據并融合計算后傳遞給根節點,葉子節點采集多種模態的健康數據并上傳給相應的節點,基于樹形結構的數據融合過程是單向傳輸的。
目前應用于WSN中的數據融合函數結構可以表示為式(1):
f(t)=φ[d1(t),…,dn(t)]
(1)
式中:di(t),(i=1,2,…,n)表示節點i在t時刻采集得到的數據,算子φ表示融合計算因子,比如count、average、max、min等sum函數[9]。
作為WSN在健康醫療領域分支和具體應用的WBSN,其所采集傳輸的是人體多模態健康數據,其中某些模態的數據具有明顯的周期特性:比如,脈搏信號、心電信號、腦電信號等,而且人體健康數據在大多數時間是基本正常的,對健康分析更有價值的往往是那些異常信號。因此,可以在WBSN的數據分片和傳輸策略設計時考慮上述領域特點,對于大量存在的周期性正常數據進行壓縮處理,重點收集偶發性的異常數據,從而降低無線傳感器網絡的數據通信量。本文提出基于不等長時間間隔的數據融合函數如式(2):

(2)

2.2 基于重復性歸約因子的數據融合算法
本文在SMART系列算法[9]基礎上進一步改進,針對WBSN應用提出一種基于重復性歸約因子(SMART-Repeatability Reduction)的數據融合算法SMART-RR。
數據加密解密采用隨機密鑰分配策略:產生一個包含K個密鑰的密鑰池,從中隨機選取k個密鑰(k SMART算法基本結構包括3個主要步驟:(1)Slice. 每個節點將采集得到的數據分成J片,其中J-1片發送到從相鄰節點集中隨機選取的J-1個節點;(2)Mix. 節點收到分片數據后利用共享密鑰解密;(3)AggRegaTe. 利用TAG算法進行數據融合。WBSN中某些模態的數據具有明顯的周期重復性,加入重復性歸約因子的SMART-RC算法針對這一特點將數據采集傳輸時間間隔根據不同模態數據劃分為不等長的時間片,并對時間片內的周期重復性數據進行歸約,限制數據通信量以降低無線傳感器網絡能耗。根據采集得到的數據是否具有周期重復性,節點可以分為周期性節點集Vr和非周期性節點集Vu。 SMART-RR算法流程 輸入:無線體域網WBSN的數據融合樹結構G(V,E),節點集合i∈Vr(脈搏、心電傳感器節點)和i∈Vu(體溫、血氧傳感器節點) 輸出:數據融合結果D。 1. WHILE 節點i∈V,Vi?V DO 2. 節點i在h跳內隨機選擇節點集Vi 3. 計算節點i的數據傳輸時間間隔參數Δti 4. END WHILE 5. IF 節點i∈Vr 6. 時間間隔設定Δti=10tr 7. IF 10個周期的時域特征Ft-domain相等 8. 去除重復性保留1個向量值; 10. END IF 11. END IF 12. WHILE 節點jd∈ViDO 13.J-1片壓縮數據發送到節點jd 14. 節點jd利用共享密鑰解密; 15. END WHILE 16. 輸出結果:數據融合結果D 相比于SMART算法,加入重復規約因子的SMART-RR算法能夠大量減少由于周期重復性健康數據傳輸所造成的通信負載,雖然每個節點對于數據傳輸時間間隔Δti的計算相比SMART算法消耗一定時間和處理資源,但是分析可知時間復雜度為O(1)并且不需要每次計算,因此產生的額外開銷可以忽略。 為了驗證本文提出的基于重復性規約因子的SMART-RR算法的性能,本節從隱私保護性、數據通信量和精確度3個方面進行仿真實驗,并將SMART-RR算法與TAG算法、SMART算法進行對比分析,選取包含脈搏、心電、體溫和血氧四類生理參數的仿真數據進行比對。 3.1 隱私保護性 SMART算法和SMART-RR算法的隱私保護性主要來自于數據分片傳輸和加密解密機制[12]。每個節點采集到的數據被分為J片并向相鄰節點發送其中的J-1片數據,只有當竊聽者獲取所有J-1個出度鏈路和所有入度鏈路才能解密該節點此次發出的完整信息。 節點采集得到的數據被竊聽解密的概率P可以表示為式(3): (3) 式中:p=k/K表示由于密鑰分配策略導致的數據被竊聽的概率,D表示網絡中所有節點的入度最大值,Pd=λ表示節點入度為λ的概率。 SMART算法和SMART-RR算法的隱私保護性均符合式(3),TAG算法沒有引入隱私保護策略,因此隱私保護性弱于前兩種算法。SMART-RR算法的隱私保護性如圖3所示。 圖3 SMART-RR算法的隱私保護性 從仿真實驗結果可以看出,SMART-RR算法由于采用了數據分片傳輸與加密解密方式,能夠更好地實現數據隱私保護效果,當J≥3時無健康數據被竊聽的概率可以控制在小于0.5%的范圍內,這在健康醫療領域的實際應用能夠滿足要求。測試結果也指導我們在設計基于WBSN的人體健康數據監測系統時對于節點數據分片片數應該設定在3片以上才能保障個人健康數據的隱私保護性。 3.2 數據通信量 應用于人體健康數據監測的WBSN節點能耗直接影響了傳感器網絡的生存時間和可用性,由前文分析可知節點能耗主要消耗在無線網絡的數據通信過程中。因此,應該盡可能降低WBSN節點的數據通信量從而有效控制傳感器節點能耗[13]。 用于WBSN數據融合隱私保護技術的數據通信量主要包括節點分片數據發送通信量和數據融合通信量。數據融合通信量與網絡規模直接相關,即WBSN網絡結構和節點數量確定后數據融合通信量固定。因此對比分析SMART-RR算法與SMART算法的節點分片數據發送通信量,這也是基于數據分片隱私保護算法主要的通信量額外開銷。TAG、SMART、SMART-RR 3種算法的數據通信量如圖4所示,其中SMART和SMART-RR中的J都設定為3。 圖4 TAG、SMART、SMART-RR算法的通信量 從仿真結果可以看出,由于加入數據分片策略,SMART和SMART-RR算法的數據通信量均小于TAG算法,而且由于SMART-RR對存在重復性數據進行了一定的歸約操作,因此數據通信量得到進一步壓縮。對SMART-RR算法數據分片數與通信量之間關系進一步分析,從圖5仿真結果可以看出隨著J的增大數據通信量出現先增大后減小的趨勢。 圖5 SMART-RR算法通信量隨分片數變化 圖6 SMART-RR算法精確度隨分片數變化 3.3 精確度 本文所提出的SMART-RR算法與SMART算法都是基于SUM函數[9]進行數據融合計算,定義數據精確度為: c=|DQS|/|∑Di| (4) 式中:|DQS|為融合后根節點的數據量,|∑Di|為所有傳感器節點采集得到的原始數據量。如圖6所示,SMART-RR算法的數據精確度對分片數J比較敏感,當J≥5時精確度成顯著提高趨勢,當J≥8是精確度趨于穩定。 綜合上述對于算法隱私保護性、數據通信量和精確度的仿真分析,可以看出在SMART-RR算法中數據分片數J的設定直接影響算法性能,應該在實際應用中根據隱私保護性等具體要求選擇更加合適的參數。 本文針對應用于人體健康數據采集與分析系統的WBSN數據融合隱私保護算法需求,提出了一種基于重復性歸約因子的數據融合算法,能夠面向人體周期重復性明顯的某些健康體征數據進行數據壓縮,從而降低傳感器節點的數據通信量和能耗,延長WBSN生存時間。通過仿真實驗與對比分析驗證了算法在隱私保護性、數據通信量和精確度等方面性能,與同類型算法相比在人體健康數據采集應用領域具有一定優勢。進一步的工作可以進一步研究其他數據融合策略的隱私保護算法,收集更多實際案例分析算法的應用價值。 [1] 宮繼兵,王睿,崔莉. 體域網BSN的研究進展及面臨的挑戰[J]. 計算機研究與發展,2010,47(5):737-753. [2] 王明宇,楊吉江,陳昊,等. 基于體域網和云平臺的遠程數字健康系統發展的研究[J]. 計算機科學,2012,39(6A):195-200. [3] Gravina R,Alinia P,Ghasemzadeh H,et al. Multi-Sensor Fusion in Body Sensor Networks:State-of-the-Art and Research Challenges[J]. Information Fusion,2017,35:68-80. [4] 孫凌逸,黃先祥,蔡偉,等. 基于神經網絡的無線傳感器網絡數據融合算法[J]. 傳感技術學報,2011,24(1):122-127. [5] 邱立達,劉天鍵,林南,等. 基于深度學習模型的無線傳感器網絡數據融合算法[J]. 傳感技術學報,2014,27(12):1704-1709. [6] He W,Liu X,Nguyen H,et al. PDA:Privacy-Preserving Data Aggregation in Wireless Sensor Networks[C]//Proceeding of the 26th IEEE International Conference on Computer Communications. Anchorage,AK. 2007:2045-2053. [7] Ruj S,Nayak A,Stojmenovic I. Fully Secure Pairwise and Triple Key Distribution in Wireless Sensor Networks Using Combinatorial Designs[C]//Proceeding of the 30th IEEE International Conference on Computer Communications. Shanghai,China,2011:326-330. [8] Castelluccia C,Mykletun E,Tsudik G. Efficient Aggregation of Encrypted Data in Wireless Sensor Networks[C]//Proceeding of the 2nd Annual International Conference on Mobile and Ubiquitous Systems:Networking and Services. San Diego,USA,2005:109-117. [9] 楊庚,李森,陳正宇,等. 傳感器網絡中面向隱私保護的高精確度數據融合算法[J]. 計算機學報,2013,36(1):189-200. [10] 彭向東,張華,劉繼忠. 基于過完備字典的體域網壓縮感知心電重構[J]. 自動化學報,2014,40(7):1421-1432. [11] 劉毅,宋余慶,劉哲,等. 一種面向體域網的ECG信號小波閾值去噪法[J]. 計算機科學,2014,41(11):175-178. [12] Madden S,Franklin M J,Hellerstein J M. TAG:A Tiny Aggregation Service for Ad-Hoc Sensor Networks[C]//Proceeding of the 5th Symposium on Operating System Design and Implementation. New York,USA,2002:131-146. [13] 張偉,顏仕星,李國正. 無線脈搏波測量及性別區分—基于在體傳感網的多點測量應用[J]. 計算機工程與應用,2010,46(35):231-234. 翟羽婷(1982-),女,碩士學位,張家口學院理學院講師,從事計算機教學工作,主要研究方向包括無線傳感器網絡、信號傳輸隱私保護技術、計算機聯鎖技術等; 史春燕(1983-),女,碩士學位,張家口學院理學院講師,從事計算機教學工作,主要研究方向包括無線傳感器網絡、多模態數據融合算法等; 王磊(1982-),男,博士學位,碩士生導師,中國科學院蘇州生物醫學工程技術研究所副研究員,從事醫療健康軟件研發工作,主要研究方向包括無線傳感器網絡、數據挖掘與數據融合算法、醫療健康人工智能應用研究等,wanglei@sibet.ac.cn。 AnEnergy-SavingandPrivacyPreservingDataFusionAlgorithminWirelessBodySensorNetwork* ZHAIYuting1,SHIChunyan1,WANGLei2* (1.College of Science,Zhangjiakou University,Zhangjiakou Hebei 075000,China;2.Suzhou Institute of Biomedical Engineering and Technology,Chinese Academy of Sciences,Suzhou Jiangsu 215163,China) Wireless body sensor network could collect and analyze the multi-modal health data of human body in real time by means of energy-saving and high-accuracy sensor technology,and the sensitive data related to personal privacy should be protected in the process of data transmission. Aiming at the requirement of privacy preserving in the data fusion process of wireless body sensor network,a new SMART-RR algorithm is proposed in this paper,in which an unequal time interval and repetitive data reduction joined factor data fusion strategy is embedded in the algorithm using the characteristics that human health data is cycle repeatability and redundancy. Simulation results show that the SMART-RR is an energy-saving privacy preserving data fusion algorithm with small data communications,high privacy protection and accuracy,and has certain application value in human health signs oriented data acquisition of wireless body sensor network domain. wireless body sensor network;data fusion;privacy preserving;energy-saving;repeatability reduction TP393 A 1004-1699(2017)11-1734-06 項目來源:江蘇省政策引導類計劃—前瞻性聯合研究項目(BY2016049-01) 2017-03-07修改日期2017-07-06 10.3969/j.issn.1004-1699.2017.11.0203 實驗與性能分析




4 結論


