李 波,聶增麗,暢君元
(1. 重慶工程學院,重慶 400056;2. 重慶郵電大學,重慶 400065)
隨著互聯網技術的飛速發展與普及應用,數據外包服務憑借低廉的價格、按需購買等諸多優勢,被越來越多的用戶所關注與依賴,這除了使人們的生活形式得到了大幅度的改善,也引發了諸如數據機密性、完整性以及可用性等一系列的安全問題。其中,個人或者團隊在管理隱私或者敏感數據方面會大量應用到物聯網[1],所以需要將數據安全性作為至關重要的考慮指標。對數據實施加密是確保數據機密性的一種有效手段,但當密文[2]數據產生過多時,就無法繼續進行數據源的集成,使數據丟失原本屬性。
因此,為了實現異構物聯網密文數據的集成增量與速率提升,本文提出一種嵌入式異構物聯網密文數據動態捕獲方法。對數據時間信息實施尺度變換,獲取初始數據頻率信息,基于不同的初始數據獲得不同的小波系數,采用小波變化對其進行重構,隨后令物聯網簇數據分類滿足平方誤差和為最小值,利用映射函數轉換最小二乘支持向量機,并選取松弛變量代替其中的對應指標,實現帶約束極小值優化問題的變換,通過拉格朗日乘函數的創建,提出對偶優化問題,從而推導出其約束條件,采用核函數對最小二乘支持向量機的非線性回歸表達式進行架構,完成異構數據的融合與冗余濾除,依據對稱加密算法與公鑰加密算法,對物聯網數據進行加密,通過達成明文數據的混合加密得到密文數據,根據密文數據信號表達式,采用部分相干積累法強化數據信號能量,經過歸一化處理對高斯白噪聲的分布情況進行轉換,從而實現密文數據的動態捕獲。
為了更好地實現物聯網密文數據的動態捕獲,應深入探析嵌入式異構物聯網密文數據的形成過程。
采用小波變換[3]對嵌入式異構物聯網的初始數據進行平移變換處理,尺度變換數據時間信息,獲取初始數據頻率信息。假設物聯網初始數據s(t)中存在噪聲e(t),兩者關系式如下所示
s(t)=f(t)+δe(t)
(1)
式中,高質量數據表示為f(t)。
因為噪聲會干擾物聯網的數據傳輸,使可用數據被掩蓋,無法進行數據處理,從而造成能耗與帶寬的浪費,所以,要先完成初始數據的過濾處理。假定小波變換函數ψ(t)為平方可積函數,且符合下列不等式

(2)
采用下列積分方程式來表示小波變換

(3)
對于異構物聯網數據的小波變換去噪,通過變換初始數據獲得不同的小波系數,依據閾值對噪聲系數進行去除,通過小波變換重構留存的小波系數,實現物聯網數據的降噪處理。
由于物聯網的簇[4]中傳感器距離較近,有很大可能性會出現對同一目標狀態數據進行采集的情況,引發嚴重的簇中數據時間與空間冗余,所以,通過K-means算法來冗余濾除與融合簇中所含數據。
由物聯網簇中n個數據構成的D={x1,x2,…,xn}樣本集合,如果令數據分類滿足平方誤差和為最小值,則得到類別集合C={C1,C2,…,Ck},其中,k為類別個數,因此,利用下列公式對平方誤差和進行界定

(4)
式中,第i個類別數據的平均矢量為μi,其界定公式如下所示

(5)
物聯網數據融合通過最小二乘支持向量機[5]算法得以實現,若{(xi,yi),i=1,2,…,n}數據集合中的xi為輸入,yi指代輸出,那么,采用映射函數φ(x)變換最小二乘支持向量機,下式即為得到的數學表達式
f(x)=wTφ(x)+b
(6)
式中,最小二乘支持向量機的權重矢量與偏置量分別為w、b。


(7)
優化問題的約束條件如下所示
yi-wTφ(x)+b=ei
(8)
式中,最小二乘支持向量機輸出偏差為ei,正則化因子為γ。
利用拉格朗日[7]乘子αi對拉格朗日乘函數進行創建,以簡化極小值優化問題,使最小二乘支持向量機的學習效率得到提升,得出下列所示的對偶優化問題

(9)
推導出對偶優化問題的約束條件,如下所示

(10)
由于嵌入式異構物聯網的數據預處理存在非線性變化屬性,所以,采用核函數[8]對最小二乘支持向量機的非線性回歸表達式進行架構,分別如下所示
K(xi,xj)=φ(xi)Tφ(xj)
(11)

(12)
式中K(xi,xj)的界定公式如下所示

(13)
其中,核寬度表示為σ。
各簇頭均會融合自身簇中的數據,因傳感器接收到較多異構數據,使異構數據之間產生冗余,所以,在求取各簇頭數據的融合權重后,利用權重對物聯網數據進行預處理。
采用混合加密算法對預處理后的物聯網數據進行加密,生成嵌入式異構物聯網密文數據。混合加密算法中對稱算法加密與解密的密鑰相同,各元素單元均由一個五元組集合所組成,通過下列表達式描述各元素單元
CS={M,C,K,e,d}
(14)
式中,明文數據集合為M,且M={m};密文數據集合為C,且C={c};密鑰[9]集合為K,且K={k};指定的加密映射分別為e、d,e描述的是密鑰對明文數據實施加密生成密文數據的階段,d表示的則為密鑰對密文數據實施解密生成明文數據的階段。其中,密鑰k為加密與解密過程中的關鍵因素。
混合加密算法中公鑰加密法的元素單元組成與五元組對應功能均相同于對稱加密法,唯一不同的便是密鑰集合e。對稱加密法的密鑰具有獨一性,可以加密與解密,獲知對象只有用戶自己,而公鑰加密法的加密公鑰ek則能夠被所有用戶獲知,解密私鑰dk與加密公鑰ek之間僅有對應關系。
為了保證密文數據的安全性,分別利用對稱加密法與公鑰加密法,對明文數據實施混合加密,因為反向進行加密操作就是解密過程,所以,密文數據的解密還需要使用算法生成的對應私鑰才能得以實現。將兩種算法處理的密文進行整合,得到最后的密文數據。
采用下列表達式對異構物聯網密文數據的接收信號進行描述
R(iTs)=AD(iTs-τ)C(iTs-τ)
*cos[2π(f0+fd)iTs+φ0]+n(i)
(15)
式中,輸入信號多普勒頻移表示為fd,載波中心頻率為f0,信號幅度表示成A,測控數據與偽碼調制分別是D(*)與C(*),碼相位延遲表示為τ,初始載波相位為φ0,基于中頻帶寬的高斯噪聲是n。

I(k)=0.5AD(k)R(ρ(k))Sa[πTΔfd(k)]

(16)
Q(k)=0.5AD(k)R(ρ(k))Sa[πTΔfd(k)]

(17)

Δfd(k)=fd(k)-d(k)
(18)

(19)

(20)
T=nTs
(21)
密文數據經過轉換,應滿足下列表達式
A′=0.5AR(ρ(k))*Sa[πTΔfd(k)]
(22)
根據上列表達式,轉換I、Q兩路密文數據信號為下列表達式

(23)

(24)
通過局部相干積累法,相關接收碼與本地偽碼,最后實施累計,以使捕獲方法的處理增益有所提升。雖然相干積累能夠強化密文數據信號能量,但是也會同時引發多普勒失諧,也就是會導致累計的相關值隨著載波頻率偏移量的變大而減小,而且頻譜分析累計值同樣會在一定程度上降低峰值。
針對相干積累,依據積分累計時間的信號關系,積累信號能量,由于高斯噪聲在此期間并不存在相關性,所以,噪聲取值是0,無法進行能量積累。因數據跳變將對能量積累產生影響,因此,采用非相干積累來進行通信數據傳輸。非相干積累過程里,應平方處理相干積分的I與Q兩路密文數據信號,從而完成線性計算。其中的平方運算不僅增加了信號能量,也積累了噪聲能量,所以,平方損耗即為噪聲能量變大所產生的信噪比損耗。
假設相干積累值為I(k)和Q(k),令A′與φ(k)分別滿足下列等式
A′=0.5AR(ρ(k))Sa[πTΔfd(k)]
(25)
φ(k)=Δfd(k)kT+φ0
(26)
就能夠推導得出下列相干積累值I(k)和Q(k)對應的表達式:

(27)

(28)

歸一化處理所得密文數據信號,得出下列式(24)的改寫表達式

(29)
關于非相干積累,經過變換的密文數據值表達式如下所示

(30)
式中,非相干積累次數表示為k。
通過上述流程的完成,即可對密文數據進行動態捕獲。
仿真環境采用英特爾奔騰4.3GHz主頻處理器,運行內存為3GB,操作系統是centos2.6.18內核Linux,控制芯片為英特爾82543型號,網卡的型號是Pro1000,網卡驅動程序是E1000型號。
物聯網仿真拓撲如圖1所示。

圖1 物聯網拓撲示意圖
圖1(a)中的兩網卡用交叉線進行直連,一個是接收端,一個是發送端;圖1(b)是一種帶有鏡像性能的千兆交換機,鏡像端口選取為捕獲密文數據包所用的端口,對剩余端口密文數據進行監聽,完成密文數據的捕獲實驗。
為了驗證本文方法的精準性與有效性,分別采用基于塊級的數據捕獲方法、倒排索引方法以及本文方法,對動態捕獲指標參數進行獲取,整理得到下列接收流量統計表。

表1 密文數據接收流量統計表(單位Mbps)
當密文數據規格為64 kB時,塊級方法的密文數據接收流量為298Mbps,倒排索引方法的密文數據接收流量為278Mbps,本文方法的密文數據接收流量為402Mbps。當密文數據規格為1024kB時,塊級方法的密文數據接收流量為718Mbps,倒排索引方法的密文數據接收流量為701Mbps,本文方法的密文數據接收流量為827Mbps。綜合表中數據得出結論,本文方法的流量接收性能隨著密文數據的不斷增大而大幅度提升,且所接收的密文數據流量遠高于塊級方法。
表2為三種動態捕獲方法的接收速率指標數據統計表。

表2 密文數據接收速率統計表(單位pps)
當密文數據規格為64 kB時,塊級方法的密文數據接收速率為652095 pps,倒排索引方法的密文數據接收速率為632115 pps,本文方法的密文數據接收速率為674083 pps。
通過表中數據可以看出,兩方法均與數據規格成反比關系,但相對比塊級方法的接收速率,本文方法的速率更快,具有顯著的優越性。
為了驗證不同方法對密文數據的捕獲效率,統計采用塊級方法、倒排索引方法以及本文方法的數據捕獲用時,得到結果如所示。

圖2 不同方法下密文數據捕獲用時
分析圖2可知,對于數據量的數據來說,不同方法的捕獲用時不同。當數據量為100 bit時,塊級方法的密文數據捕獲用時為5s,倒排索引方法的密文數據捕獲用時為5s,本文方法的密文數據捕獲用時為0.3s。當數據量為900 bit時,塊級方法的密文數據捕獲用時為29s,倒排索引方法的密文數據捕獲用時為32s,本文方法的密文數據捕獲用時為3.5s,本文方法密文數據捕獲用時明顯低于其它兩種方法。綜合整體結果可知,本文方法的數據捕獲用時一直較低,具有較大優勢。
本文提出一種嵌入式異構物聯網密文數據動態捕獲方法。通過實驗可以得出以下結論:
1)當密文數據規格為1024 kB時,本文方法的密文數據接收流量為827Mbps,說明本文方法的密文數據接收流量大。
2)當密文數據規格為64 kB時,本文方法的密文數據接收速率為674083 pps,說明本文方法的密文數據接收速率快。
3)當數據量為900 bit時,本文方法的密文數據捕獲用時僅為3.5s,密文數據捕獲效率較高。