基于信源編碼的數據融合隱私保護技術

2016-02-26 19:57:53胡濤李嶠周宇

科技視界 2016年3期

胡濤　李嶠　周宇

【摘要】針對數據融合過程的隱私保護應用需求，基于信源編碼理論將數據模值編碼與數據融合的過程相結合，設計了一種具有隱私保護能力的融合方法。該方法根據信源編碼思想，從數據編碼的角度實現深層次數據融合。理論分析和實驗結果表明，該算法能夠在較低開銷的前提下實現數據融合隱私保護。

【關鍵詞】無線傳感器網絡；數據融合；隱私保護；信源編碼

0 引言

無線傳感器網絡中數據融合過程的隱私保護技術按照其實現數據隱藏的原理，主要可以分為兩大類：即通過數據形式變換實現隱私保護和和通過加密技術實現的隱私保護。為了實現精確感知的需求和對單個節點失效的魯棒性，WSN往往需要進行密集部署，這使得感知數據間存在豐富的空間相關性和冗余性。由于無線傳感器網絡的能耗主要集中在數據傳輸上且與數據發送量成正比，所以這些冗余信息將會造成巨大的能量浪費。分布式信源編碼為消除這種相關性提供了很好的思路，它可以使得各相關信源在不用相互通信的情況下進行獨立編碼，并獲得與相互通信同樣的數據壓縮性能，目前在WSN領域中得到了廣泛的研究。由于分布式信源編碼的特征，該技術可以很好的和數據融合結合起來，從數據編碼的角度實現深層次數據融合。

1 理論基礎與研究現狀

1973年提出的Slepian-Wolf理論是分布式信源編碼的理論基礎，本文首先對該理論進行簡要介紹，然后對基于該理論的模值編碼進行闡述，為本文所提的基于信源編碼的隱私保護方法提供理論依據。

根據Slepian-Wolf編碼理論，對兩個互相關的信號源X，Y進行編碼，如果X和Y知道彼此的互相關信息，那么X就可以在不需要事先知道Y的情況下獲得與事先知道Y一樣的編碼效率，即圖1所示的兩種編碼方案的效果是一樣的。但是獨立編解碼方案不需要與Y進行通信，因此可以減少通信能耗，這一點對于能量受限的無線傳感器網絡來說是十分有利的。

在Slepian-Wolf編碼理論中將Y稱作邊信息。對X和Y進行獨立編碼，并在譯碼端進行無失真地聯合譯碼，需要滿足以下條件：對兩個互相關的信號源X，Y進行編碼，如果X和Y知道彼此的互相關信息，比如聯合概率分布p（x，y），那么X就可以在不需要事先知道Y的情況下獲得與事先知道Y一樣的編碼效率。但是獨立編解碼方案不需要與Y進行通信，不但具有更大的靈活性，同時還可以減少通信能耗，保護數據的隱私性。在Slepian-Wolf編碼理論中將Y稱作邊信息。對X和Y進行獨立編碼，并在譯碼端進行無失真地聯合譯碼，需要滿足：

其中Rx，Ry表示X和Y的編碼速率，H（XY），H（YX）分別表示對應的條件熵，H（X，Y）表示兩者的聯合熵。

Slepian-Wolf編碼理論針對兩個相關信源，主要方法包括伴隨式的分布式信源編碼，Turbo碼，LDPC碼方法，模值方法等。

2 基于信源編碼的數據融合技術

考慮到無線傳感器網絡的應用場景，其數據相關性往往表現為其差值在一定范圍內且監測值連續，因此，本文中采用模值編碼方式實現數據融合過程的數據表示。在模式編碼中，首先作如下約定：設網絡節點監測的數據范圍為[mins，maxs]，數據精度表示為Δ（這一數值將由實際應用來確定），數據編碼的比特數為n，則可以得到監測的數據樣本集合如下：

算法流程如下：

Step1：構建簇型結構

首先需要構建一個分簇結構，由于該類型算法較多，其中LEACH算法應用最為廣泛，本文也采用該算法進行簇結構的建立，簇頭節點表示為CH，簇內成員節點表示為Cn。

Step2：編碼

簇頭節點根據當前測量結果向簇內節點廣播邊信息Y。根據模值編碼技術，若信源X與邊信息Y之間的差值小于2k-1Δ（0≤k≤n），則X 可以以k bit 進行編碼以實現數據壓縮的目的，即：

f（X）=index（X）mod2k （1）

其中f（X）表示X編碼后的信息比特，index（X）=（X-min s）/Δ。由此可知，由于節點在傳輸數據前首先將其進行編碼表示，因此可以實現對數據真實數值的隱藏，對于惡意節點來說，由于并不知道其編碼過程和邊信息的數值，因此即使惡意節點獲得了該編碼結果也無法得到隱私數據。

Step3：融合

首先，需要在簇頭節點進行譯碼操作：

i=‖Y-ri‖（2）

其中i表示譯碼后的結果，S表示由f（X）給出的陪集，ri表示陪集內的元素。

根據譯碼結果，簇頭節點進行融合操作，本文以加法融合為例，融合過程可表示如下：

y=i（3）

簇頭節點在獲得中間的融合結果后，再將其按照基站節點發給其的邊信息進行編碼，編碼過程如公式（1），并在編碼后將數據上傳至基站節點，基站節點按照公式（2）解碼后即可獲得最終的融合結果。

3 算法性能分析

首先，在算法的復雜度方面，模值編碼的編碼過程較為簡單，僅僅為數值計算，文獻對其算法復雜度進行了測算，編碼過程的計算復雜度較低僅為0（1）。譯碼過程的復雜度則與與陪集的元素個數成正比，這是因為需要在陪集中進行搜索對應的數值。

其次，數據通信量分析。現有的數據融合隱私保護算法大多基本可以分為三種類型，加密，分片或者安全多方計算，我們分別選擇其中的代表性方案SA算法[1]，SMART算法[2]和iPDA算法進行性能的比較。

對于SA算法，由于該算法中需要傳輸節點的ID用以檢驗數據的完整性，總的通信量為4n+ID，其中n為網絡中傳感器節點的個數，為了方便比較本文忽略ID所需要通信開銷；SMART算法主要依靠對隱私數據進行分片傳輸來達到保護隱私的目的，因此數據傳輸量主要取決于其數據的分片情況，假設分片個數為s，則總共需要傳輸的數據量應該為s*n。iPDA算法中，由于通過采用安全多方計算的方式來對信息的隱私性進行保護，網絡中的通信量為3（1-pc）n+6pc*n，其中pc為成為簇頭的概率。而本文算法的數據通信量由于進行了信源編碼的壓縮，僅為pd*n，其中pd為壓縮的比例。比較結果如圖2所示。

4 總結與展望

借助于網絡數據的相關性，本文將信源相關編碼技術引入數據融合隱私保護方案，重點研究了如何在數據融合場景下實現基于模值的編碼和譯碼。在數據傳遞過程中不需要參考信息數值的情況下，節點對采集到的隱私數據進行獨立編碼并傳輸，從而實現了數據融合過程的隱私保護。

【參考文獻】

[1]HU Lingxuan， EVANS D. Secure aggregation for wireless networks[C].Proceeding of the 2003 Symposium on Applications and the Internet Workshops， Washington， 2011：384-391.

[2]Wenbo He， Xue Liu， Nguyen H， and Nahrstedt K. A Cluster-based Protocol to Enforce Integrity and Preserve Privacy in Data Aggregation[C].Proceedings of the 29th IEEE International Conference on Distributed Computing Systems Workshops， 2009：14-19.

[責任編輯：王楠]

科技視界2016年3期

科技視界的其它文章: 淺析美國水資源管理給我們帶來的啟示; 淺議濟源市國有林場的經營管理; 四平市第二次土地調查成果應用研究; 如何搞好用材林采伐設計外業調查工作; 望江縣農村土地流轉淺議; 農業育種的空間誘變技術淺析