朱 路,劉媛媛,慈白山,潘澤中(華東交通大學信息工程學院,南昌330013)
?
多稀疏基分簇壓縮感知的WSN數據融合方法*
朱路*,劉媛媛,慈白山,潘澤中
(華東交通大學信息工程學院,南昌330013)
摘要:針對傳感器節點采集數據精度與能量消耗的矛盾,提出多稀疏基分簇壓縮感知的無線傳感器網絡WSN(Wireless Sensor Network)數據融合方法。該方法利用改進的閾值對隨機部署的傳感器節點進行簇首選擇繼而形成最優簇,簇首采用伯努利隨機觀測矩陣對簇內節點信號進行線性壓縮投影,然后將壓縮的信息傳送給匯聚節點,減少數據傳輸即降低通信能耗,從而提高網絡的生命周期。根據傳感器節點監測信號在有限差分和小波中都具有可壓縮特性,匯聚節點在有限差分和小波兩個稀疏基的約束下,利用OOMP算法分別對線形壓縮投影信息進行重構;并采用最小二乘法融合重構信號,提高數據精度。仿真實驗結果表明,多稀疏基分簇壓縮感知的WSN數據融合方法在減少數據發送的情況下,能提高整個網絡的生命周期,解決采集數據精度與網絡生命周期的矛盾。
關鍵詞:無線傳感器網絡;分簇壓縮感知;數據融合
項目來源:國家自然科學基金項目(31101081,61162015);江西省科技支撐項目(20151BBE50095)
近年來,無線傳感器網絡WSN(Wireless Sensor Network)憑借其諸多優勢,在很多領域,例如環境監測、智能家居、精準農業等得到廣泛應用。WSN的傳感器節點(下面簡稱為節點)不斷感知監測區域的信息,匯聚節點(或稱為基站)通過無線方式收集網內節點感知的信息[1]。數據收集是WSN中重要的操作之一[2],能否有效地收集數據,直接關系到應用的效果。WSN的節點通常是由能量有限的電池供電,而且在部署后難以二次補充能量,存在嚴重的能量約束問題。WSN中的能量消耗主要為通信能耗。在保證收集數據精度的同時,減少數據傳輸即降低通信能耗是目前WSN數據收集的主要問題[3]。
網內數據融合技術[4]通過一定的算法將傳感器節點采集到的大量原始數據進行處理,去除其中的冗余信息,只將少量有意義的處理結果傳輸給匯聚節點。網內數據融合減少節點間的數據通信,降低通信能耗;從而提高網絡感知效能,延長網絡生命周期。文獻[1]采用求平均、取最大、最小值等數據融合方法,通過提取WSN節點信號的某些統計特征實現數據壓縮,丟失其他信息。文獻[5]提出了一種改進型的分批估計自適應加權融合算法,采用模糊集理論根據容許函數的閾值剔除誤差較大的傳感器數據。這些方法只能應用在對數據精度要求不高的領域。文獻[6]結合卡爾曼濾波器貝葉斯融合算法,提出一種優化的貝葉斯估計多傳感器數據融合方法,有效解決了數據的不確定性和不一致性。文獻[7]對節點信號進行小波變換,然后對小波系數進行壓縮編碼。貝葉斯融合與小波變換壓縮算法計算復雜度高,不適合在處理能力有限的傳感器節點中實現。因此,在保證數據精度的同時,降低WSN數據融合的復雜度是其應用的關鍵。
壓縮感知(Compressed Sensing,CS)[8]根據原始信號包含一定結構或特征信息,采用非自適應線性投影對信號進行壓縮采樣,然后通過數值最優化問題方法重構原始信號。CS的特點是利用非線性的重構算法降低數據采集端的復雜度,保證數據壓縮并有效收集,是一種適合WSN的數據壓縮采樣方法。目前,CS在WSN的應用主要集中在平面路由(線性結構和樹形結構)[9-12]。這些方法在數據的傳輸過程中逐漸將每個節點的信息通過編碼的方式加入正在傳輸的數據,解決了網絡負載不平衡的問題,但是整個網絡的發送數據量仍然很大,有可能超過實際數據量。層次路由通過分簇LEACH(Low-Energy Adaptive Clustering Hierarchy)[13]解決平面路由網絡規模受限的問題,用于支持更大規模的網絡。文獻[14]提出了分簇協議與層疊自動編碼器(SAE)相結合的數據融合算法SAEMDA,提高了無線傳感器網絡中數據融合的性能。文獻[15]在分簇的基礎上引入CS(分簇壓縮感知,CCS)可以進一步壓縮數據。由于CCS的簇首是把線性壓縮投影信息發送給匯聚節點,線性壓縮投影本質是把高維的信號投影到低維的測量值,匯聚節點的信息重構則是一個從低維到高維的維數增加的病態問題;因此,建立合理的信號重構模型和采用最優的反演算法是信號收集精度的關鍵。文獻[11]根據WSN的數據具有區域平滑性質,即區域平滑信號在小波或時頻字典中具有稀疏性;把變換的稀疏性引入信號重構模型,可以獲得較好的重構效果。對于區域平滑信號,不僅在小波中存在稀疏特性,而且在有限差分中也存在稀疏特性,因此同時把小波和有限差分引入到信號重構模型可以提高信號重構質量。
考慮WSN節點是能量受限的,而匯聚節點不受此限制,本文在改進分簇路由協議(ILEACH)的基礎上,根據傳感器節點監測信號通常具有區域平滑性,利用線性壓縮投影降低節點的數據采集數量及復雜度,引入有限差分和小波兩個稀疏基分別重構壓縮投影信息;并采用最小二乘方法融合重構信號,提高數據精度,解決WSN收集數據精度與生命周期的矛盾。
系統假設N個節點隨機部署在一個二維正方形平面區域內。實際應用中,可以將WSN的拓撲結構抽象為一個無向加權圖G=(V,E),其中V= {Vi|i=1,2,…,N}為節點的集合,N為節點的總數,E={(Vi,Vj)|(Vi,Vj)∈V*V,i≠j}為節點之間邊的集合。同時假定該網絡具有如下性質:
密度較高的靜態網絡,即節點部署后靜止,網絡拓撲不會改變,除非節點失敗或者能量耗盡死亡。基站部署于固定位置,且是唯一的,其能量和運算能力不受限制;除匯聚節點外,其他節點初始能量相等、能量受限、地位平等,在網絡通信過程中能量不能補充,是一個同構型網絡。節點有一定的存儲空間,可以輪流成為簇頭,且具備一定的數據融合能力。節點位置是已知的,網內的節點能與基站直接通信。
多稀疏基CCS的WSN數據融合方法體系結構如圖1所示。

圖1 多稀疏基CCS的WSN數據融合系統結構
此方案的基本思想:首先根據剩余能量選擇簇首,根據距離因素和信號相關性把節點加入相應的簇;然后簇首對簇內節點的數據進行線性壓縮投影LCP(Linear Compressed Projection),把N維的信號壓縮為M維的信息,再把壓縮的信息轉發給匯聚節點。匯聚節點在不同的稀疏基下,利用OOMP算法分別重構線性壓縮投影信息,即把M維的壓縮信息還原為N維的原始信號;并采用最小二乘法融合信號。
CS的基本思想是:當信號存在稀疏或在變換基下面具有稀疏特性,觀測矩陣A在滿足RIP條件的前提下,只需采集m=O(klogN)維信息y=Am*Nx,從理論角度可以重構原始信號。換言之,觀測信號只要能在某個域中保留信號結構或包含原始信號的信息,可以通過非線性數值方法重構原始信號:

當模型(1)中w選擇x,表示信號x本身是稀疏的;假如w為θ,則信號x在變換域中存在稀疏特性。CS的性能取決于觀測信號的稀疏度和重構算法。
無線傳感器網絡大范圍監測應用中,為了保障監測數據的準確性和整個網絡保持一定的通信連通性,傳感器節點是高密集分布,這給系統帶來了數據冗余。分簇協議把鄰近的傳感器節點形成一個簇,簇內節點感知數據存在一定程度的空間相關性,這種相關性通常表現為區域平滑性(Piece?wise Smooth)。因此,這些空間數據在有限差分和小波中具有稀疏特性。針對WSN數據的多稀疏特性,本文基于CS原理和分簇路由,采用線性壓縮投影減少簇內數據發送,引入有限差分和小波正則化約束,對壓縮信息進行有效重構和融合。
2.1線性壓縮投影
假定N個節點隨機分布在監測區域中,節點i 在Tn時刻獲得一個采樣值xi。然后把Tn時刻所有節點一次快拍數據x=[x1,x2,…,xN]發送給匯聚節點。分簇路由的每一輪數據傳輸過程為:首先,簇內節點把數據發送給簇首;然后簇首把簇內節點采集的數據轉發給匯聚節點,簇首的能耗遠大于簇內成員節點。因此,減少簇首數據傳輸是降低能量消耗的關鍵。所有簇首同步產生伯努利隨機觀測矩陣;然后對簇內信號進行線性壓縮投影,即把N維的信號x(I)壓縮為M維的信息,在保證信息完備的前提下減少簇首的數據傳輸。線性壓縮投影為:

式中,ym(I)∈Rm是第I個簇首對簇內節點進行線形壓縮投影的信息;Am?n(I)∈Rm?n為第I個簇的伯努利隨機觀測矩陣,m< 隨機投影雖然壓縮了數據,但是隨機投影是全局采樣方法。只要滿足m=Ο(klogn) ,k為信號的稀疏度;壓縮的信息仍然保留原始數據結構,然后選擇最優的非線性數值方法就可以重構原始信號。匯聚節點通過TDMA調度方法收集WSN各簇首的隨機壓縮投影信息,在Tn時刻,匯聚節點獲得網絡的信息為: 式中,∪代表TDMA調度操作,因此匯聚節點收集到不同簇首的線性壓縮投影信息是相互獨立的;eI表示信息傳輸過程中引入的隨機噪聲;yap為匯聚節點接收所有簇首的線性壓縮投影信息。匯聚節點利用非線性數值方法分別重構不同簇內節點的原始數據。這種方法在保證采集信息完備的同時,能夠減少數據的傳輸及能量消耗,提高網絡的生命周期。 2.2多稀疏基的信號融合方法 由于式(3)是欠定的,如果直接對式(3)進行重構,將有無窮多個解。考慮節點監測信號具有區域平滑性,即簇內節點數據在有限差分和小波中具有稀疏性或可壓縮,把這種先驗知識作為正則因子引入信號重構模型,將獲得最優解。根據WSN信號的多稀疏性,建立有限差分和小波約束的信號重構模型: 式中,ym(I)∈Rm表示壓縮的數據;λ表示信號在差分變換域的稀疏權值,調整λ值可以達到最優稀疏;D表示有限差分操作D(x)=[dif(fx,1,2),x(:,1)-x(:,end)];Ψ表示小波變換;xI(n)∈Rn表示第Ⅰ個簇內節點采集的數據;Am*n(I)∈Rm×n為伯努利隨機觀測矩陣。雖然P0模型可以精確重構原始信號,但模型(4)是NP問題,因此方程(4)求解非常困難。本文在文獻[16]的基礎上,構造有限差分和小波字典,利用貪婪算法OOMP[17]分別重構WSN信號,然后對重構的信號進行融合。假定重構的信號分別為xⅠ1和xⅠ2,信號融合模型為: 模型(5)的第一項代表融合信號與xⅠ1和xⅠ2的接近程度,第二項引入信號的2范數,使融合信號更為平滑,方程(5)是標準的二次性,利用最小二乘法可以得到xI的解析解: 3.1數據收集精度仿真實驗 為驗證本文提出的多稀疏基WSN數據融合方法有效性,采用時空數據進行仿真(WSN:http://www. studioquer.it/giorgio/twiCS_data_ack.htm)。在小波字典信號重構中,根據時空信號的特征,分別采用Db1 和Sym4小波重構空間和時間信號。考慮匯聚節點收集的壓縮投影信息具有同構特征,本文只考慮所有節點形成一個簇的情況。在每一輪的數據傳輸過程中,簇內節點把數據發送給簇首,然后簇首把簇內節點線性壓縮投影信息轉發給匯聚節點,匯聚節點對接收的信息依次進行重構和融合。為了降低噪聲波動的影響,測試50次,取其平均值作為結果。利用不同的壓縮比對信號進行壓縮投影,獲得相應的重構信號并計算“歸一化”均方誤差NMSE(Normalized MSE):式中,x(I)為原始信號;x?(I)為重構的信號。壓縮比定義為實際采集數據個數與原始數據個數比例,稀疏比定義為數據中不為零的個數與原始數據個數比例。 考慮時間信號和空間信號在變換域的稀疏度不一樣,我們采用不同壓縮比對時空信號進行仿真。圖2(a)為壓縮比為0.4的WSN空間信號重構結果:其中Original表示原始的WSN空間信號,Recovery-TV表示采用有限差分稀疏基的重構結果,Recoverydb1表示采用DB1小波稀疏基的重構結果,Data fu?sion表示信號融合的結果。當壓縮比為0.4時,空間信號融合的結果與原始信號基本相同。圖2(b)為壓縮比為0.2的WSN時間信號重構結果:其中Original表示原始的WSN時間信號,Recovery-TV表示單獨采用有限差分稀疏基的重構結果,Recovery-sym4表示單獨采用Sym4小波稀疏基的重構結果,Data fu?sion表示信號融合的結果。圖2結果表明,多稀疏基信號融合方法優于單稀疏基信號重構方法。 圖2 CCS的WSN時空間信號重構結果 為進一步分析不同壓縮比情況,圖3利用壓縮比ratio=[0.2,0.3,0.4,0.5,0.6,0.7](橫坐標表示壓縮比)對信號進行壓縮投影,并采用三種方法重構壓縮信息。其中圖3(a)、(b)分別表示空間、時間信號在ratio=[0.2,0.3,0.4,0.5,0.6,0.7]下,三種重構方法獲得的NMSE。圖3(a)結果表明,在不同壓縮比的情況下,Data fusion的結果優于單個稀疏基的結果。對圖3(b)結果分析,當壓縮比為0.2~0.4時,Data fusion的NMSE比單個基重構降低接近20%;壓縮比為0.5~0.7的情況下,NMSE平均降低10%左右。 圖3 WSN時空信號在不同壓縮比和重構方法的NMSE 3.2網絡生命周期實驗分析 生命周期是指網絡能夠提供數據或信息服務的時間長度,是最重要的性能指標之一,通常把第一個節點、10%節點或全部節點死亡定義為生命周期。為驗證本文方法的性能,即保證數據精度的同時延長網絡生命周期,在MATLAB仿真平臺下對其進行評價,并與LEACH、ILEACH協議進行比較。在仿真實驗場景中,假定節點隨機分布于大小為100 m×100 m的區域內,匯聚節點位于(50 m,150 m)。任何一個節點都能直接和匯聚節點進行通信。本文主要仿真改進分簇路由的CS方法(ILEACH-CS)對網絡生命周期改善程度及數據重構的有效性。仿真參數設置如表1所示。 表1 網絡仿真實驗參數設置 對于網絡生命周期實驗仿真,我們設置仿真的輪數為4 000。在網絡每一輪的運行中,ILEACH-CS生命周期仿真步驟如下: 1標記仿真輪數r,選擇簇首,然后形成簇; 2簇首產生隨機數k=sqrt(0.1)*rand,k代表壓縮比,并對k進行限定,即限定壓縮比為:0.2 其中壓縮比定義為:實際采集信號長度與原始信號長度比例 3簇首對數據進行壓縮傳輸,計算簇內節點和簇首能量消耗情況 1)簇首能量損耗: if(distance(c)>do)Energy=Energy-EDA-k*1024*((Eelec+ Efs*(distance)4)*node(c);end if(distance(c) Energy=Energy-EDA-k*1024*((Eelec+Emp*(distance)4)*node(c);end 2)利用方程(1)給出的能量模型計算簇內節點能量損耗:其中,EDA表示簇首通過線性投影壓縮簇內數據消耗的能量,node(c)代表簇內節點個數 4記錄網絡死亡節點的情況 if Energy=0 node_deed=node_deed+1 if node_deed=1 first_dead=1 if node_deed=10% nodes teenth_dead=1 if node_deed= 100% nodes all_dead=1end ILEACH-CS中每個簇首的剩余能量均為相對較大的節點,且節點到基站距離及節點間的距離約束條件使得最終選出的簇首服從均勻分布,從而均衡網絡能量的消耗,延長網絡生命周期。網絡生命周期仿真結果如圖4所示,仿真記錄了三種算法第一個節點死亡輪數、10%節點死亡輪數、全部節點死亡輪數。LEACH算法第一個節點死亡輪數為452,10%節點死亡輪數為529,全部節點死亡輪數為1 146;ILEACH算法第一個節點死亡輪數為865,10%節點死亡輪數為1 189,全部節點死亡輪數為1 577;ILEACH-CS方法第一個節點死亡輪數為2 446,10%節點死亡輪數為2 870,全部節點死亡輪數為3 378。在壓縮比為0.2~0.8之間,當生命周期定義為第一個節點死亡,ILEACH- CS算法比LEACH算法生命周期提高400%左右;當生命周期定義為100%節點死亡或全部節點死亡,ILEACH-CS算法比LEACH算法生命周期提高200%左右。 圖4 3種方法網絡生命周期仿真結果 本文提出多稀疏基分簇壓縮感知的WSN數據 融合方法。該方法把小波和有限差分引入信號重構模型,利用最小二乘法融合兩個稀疏基的重構信號,提高數據重構精度。仿真結果表明,對于線性壓縮投影的WSN信號,多稀疏基信號融合方法的性能優于單稀疏基信號重構方法;本文方法能保證數據精度的同時降低網絡的能量消耗,延長網絡生命周期,解決了WSN數據壓縮采樣與數據收集精度的矛盾。雖然本文只研究改進的閾值分簇協議的壓縮感知數據收集方法,對于其他分簇拓撲結構,只要簇內節點數據具有稀疏性,該方法也將可行。本文的下一步工作將研究更為復雜的WSN信號,采用字典學習方法自適應重構線性壓縮投影信息。 參考文獻: [1]Madden S,Franklin M,Hellerstein J,et al. TAG:A Tiny Aggrega?tion Service for Ad-hoc Sensor Networks[C]//Proc of the Fifth Symposium on Operating Systems Design and implementation,Boston,2002,36(SI). [2]Wang C,Ma H D,He Y,et al. Adaptive Approximate Data Collec?tion for Wireless Sensor Networks[J]. IEEE Trans on Parallel and Distributed System,2012,23(6):1004-1016. [3]Xu L,Qi X,Wang Y,et al.. Efficient Data Gathering using Com?pressed Sparse Functions[C]//Proc of the 32 th IEEE INFOCOM,Turin,2013. [4]Kasirajan P,Larsen C,Jagannathan S. A New Data Aggregation Scheme via Adaptive Compression for Wireless Sensor Networks [J]. ACM Trans on Sensor Networks,2012,9(1):1-26. [5]王華東,王大羽.一種改進的多無線傳感器數據分批估計自適應加權融合算法[J].傳感技術學報,2015,28(8):1239-1243. [6]張品,董為浩,高大冬.一種優化的貝葉斯估計多傳感器數據融合方法[J].傳感技術學報,2014,27(5):644-647. [7]Ciancio A,Pattem S,Ortega A,et al. Energy Efficient Data Repre?sentation and Routing for Wireless Sensor Networks Based on A Distributed Wavelet Compression Algorithm[C]//Proc of IPSN,2006:309-316. [8]Donoho D. Compressed sensing[J]. IEEE Trans. on Information Theory,2006,52(4):1289-1306. [9]Haupt J,Bajwa W U,Rabbat M,et al. Compressed Sensing for Networked Data[J]. IEEE Signal Processing Magazine,2008,25 (2):92-101. [10]Xiang L,Luo J,Rosenberg C. Compressed Data Aggregation:En?ergy-Efficient and High-Fidelity Data Collection[J]. IEEE/ACM Trans on Networking,2013,21(6):1722-1735. [11]Luo C,Wu F,Sun J,et al. Efficient Measurement Generation and Pervasive Sparsity for Compressive Data Gathering[J]. IEEE Trans. on Wireless Communications,2010,9(12):3728-3738. [12]Ebrahimi D,Assi C. Optimal and Efficient Algorithms for Projec?tion-Based Compressive Data Gathering[J]. IEEE Communica?tion Letters,2013,17(8):1572-1575. [13]Heinzelman W R,Chandrakasan A. An Application-Specific Pro?tocol Architecture for Wireless Microsensor Networks[J]. IEEE Trans on Wireless Communications,2002,1(4):660-670. [14]邱立達,劉天鍵,林南,等.基于深度學習模型的無線傳感器網絡數據融合算法[J].傳感技術學報,2014,27(12):1705-1709. [15]Xie R,Jia X. Transmission-Efficient Clustering Method for Wire?less Sensor Networks Using Compressive Sensing[J]. IEEE Trans Parallel and Distributed Systems,2014,24(3):806-815. [16]Patel V M,Maleh R,Gilbert A C,et al. Gradientbased Image Re?covery Methods from Incomplete Fourier Measurements[J]. IEEE Trans Image Processing,2012,21(1):94-105. [17]Rebollo N L,Lowe D. Optimized Orthogonal Matching Pursuit Ap?proach[J]. Signal Processing Letters,IEEE,2002,9(4):137-140. 朱路(1976-),男,江西人,通信作者,華東交通大學信息學院副教授,2009年畢業于華中科技大學獲博士學位,碩士研究生導師,主要研究方向:無線傳感器網絡,微波輻射成像,壓縮感知,luyu?anwanwan@163.com; 劉媛媛(1978-),女,江西人,華東交通大學信息學院講師,2007年畢業于華東交通大學獲碩士學位,主要研究方向:無線傳感器網絡,數據聚合; 慈白山(1990-),男,山東人,華東交通大學信息學院碩士研究生,主要研究方向為:無線傳感器網絡。 The Method of Data Aggregation for Wireless Sensor Network Based on Cluster Compressed Sensing of Multi-Sparsity Basis* ZHU Lu*,LIUYuanyuan,CI Baishan,PAN Zezhong Abstract:A novel data fusion method for WSN(Wireless Sensor Network)based on cluster compressed sensing (CCS)of multi-sparsity basis is presented to solve the contradiction between data accuracy collected and energy consumption in sensor nodes. In the proposed method,the improved threshold is adopted to select cluster head and form optimization cluster from the random deployment of sensor nodes,and the Bernoulli random matrix is utilized to linearly compress sensor data in the cluster by every cluster head,then the compressed information is transmitted to the sink,so it reduces data transmission and energy consumption of communication,thus improving the lifetime of network. According to monitor signals being of sparsity in finite difference and wavelets,the sink uses OOMP al?gorithm to reconstruct linear compression projection information from the finite difference and wavelets sparsity ba?sis respectively. And the least square method is adopted to get together the two different reconstruction signals which can improve data accuracy. Simulation experiment results show that the data fusion method of WSN based on CCS of multi-sparsity basis can guarantee data accuracy collected,and improve the lifetime of whole network at the same time,to solve the contradiction between dataaccuracy collected and network lifetime. Key words:wireless sensor network;cluster compressed sensing;datafusion doi:EEACC:7230;722010.3969/j.issn.1004-1699.2016.03.019 收稿日期:2015-05-15修改日期:2015-12-15 中圖分類號:TP393 文獻標識碼:A 文章編號:1004-1699(2016)03-0417-06



3 仿真及結果分析





4 結論



(School of Information Engineering,East China Jiaotong University,Nanchang 330013,China)